سرانجام انتظارها به پایان رسید و شرکت OpenAI از جدیدترین دستاورد خود، مدل هوش مصنوعی پیشرفته جیپیتی ۵ (GPT-5)، پردهبرداری کرد. این مدل پیشرفته که برای انجام وظایف پیچیده و ارائه پاسخهای دقیقتر توسعه یافته، از امروز به عنوان مدل پیشفرض و رایگان در اختیار تمام کاربران ChatGPT قرار میگیرد تا تجربهای نوین از تعامل با هوش مصنوعی را رقم بزند.
سم آلتمن، مدیرعامل OpenAI، در رویداد معرفی این محصول، جیپیتی ۵ را یک جهش بزرگ در مقایسه با نسلهای قبلی توصیف کرد. او برای تشریح این پیشرفت، تجربهی کار با جیپیتی ۵ را به اولین آیفون مجهز به نمایشگر رتینا تشبیه کرد؛ محصولی که پس از استفاده از آن، بازگشت به مدلهای قدیمیتر تقریبا غیرممکن به نظر میرسید. آلتمن همچنین به سیر تکاملی هوش مصنوعی این شرکت اشاره کرد و گفت: «اگر GPT-3 شبیه به یک دانشآموز دبیرستانی و GPT-4 مانند یک دانشجوی باهوش بود، مکالمه با GPT-5 برای اولین بار حس صحبت با یک متخصص دارای مدرک دکتری را تداعی میکند».
قابلیتهای GPT-5
GPT-5 یک مدل یکپارچه با سه بخش اصلی است؛ یک مدل سریع برای پاسخهای عمومی، یک مدل استدلال عمیق (GPT-5 Thinking) برای مسائل دشوارتر، و یک حالت خاص که بسته به نوع مکالمه، پیچیدگی موضوع، نیاز به ابزار و حتی درخواست مستقیم کاربر، تصمیم میگیرد کدام مدل استفاده شود. این حالت خاص به صورت مداوم بر اساس دادههای واقعی آموزش میبیند تا دقت و کیفیت پاسخها را بهبود دهد. در صورت رسیدن به محدودیت استفاده، نسخههای کوچکتر مدل، پاسخگویی را ادامه خواهند داد.
انتخاب خودکار مدل هوش مصنوعی بر اساس سختی پرسش
یکی از تغییرات کلیدی در رابط کاربری چت جی پی تی، حذف گزینهی انتخاب مدل است. GPT-5 با یک سیستم هوشمند طراحی شده که به صورت خودکار پرسشهای پیچیده را تشخیص میدهد و برای پاسخ به آنها، از نسخهی قدرتمندتری برای استدلال بهره میبرد. کافی است کاربر در دستور خود از عبارت «Think hard» استفاده کند تا این قابلیت فعال شود.
آلتمن پیشبینی میکند این مدل آغازگر عصری جدید تحت عنوان «نرمافزار برحسب تقاضا» باشد. مایکل ترول، مدیرعامل شرکت Cursor، با تحسین این مدل میگوید: «GPT-5 باهوشترین مدلی است که برای کدنویسی استفاده کردهایم. این مدل نه تنها خطاهای پیچیده را شناسایی میکند، بلکه میتواند برنامههای چندمرحلهای را به سرانجام برساند؛ کاری که مدلهای قبلی در آن ناتوان بودند».
نویسندگی و خلاقیت
GPT-5 بهترین همکار نوشتاری چتجیپیتی تاکنون محسوب میشود. این مدل میتواند ایدههای خام را به متنی منسجم و تأثیرگذار با عمق ادبی و ریتم طبیعی تبدیل کند. از نوشتن شعر آزاد گرفته تا تدوین گزارشها، ایمیلها و یادداشتهای اداری، GPT-5 در کنار حفظ ساختار، وضوح و خلاقیت بیشتری ارائه میدهد.
حوزه سلامت
GPT-5 دقیقترین و مطمئنترین نسخه چتجیپیتی برای پرسشهای مرتبط با سلامت است و در ارزیابی HealthBench امتیازی بالاتر از همه نسخههای قبلی کسب کرده است. این مدل بهجای پاسخهای منفعل، بهطور فعال نگرانیهای احتمالی را مطرح میکند و پرسشهایی برای ارائه پاسخ بهتر میپرسد.
همچنین پاسخها را متناسب با شرایط کاربر، سطح دانش و موقعیت جغرافیایی شخصیسازی میکند. با این حال، GPT-5 جایگزین پزشک نیست و تنها نقش یک همراه آگاه برای درک نتایج، طرح پرسشهای درست و بررسی گزینههای موجود را ایفا میکند. در کل GPT-5 با نرخ خطای تنها 1.6 درصد در ارائهی اطلاعات بهداشتی، به ابزاری قابلاعتمادتر تبدیل شده است.
کدنویسی
دادههای ارائهشده نشان میدهد که GPT-5 در طیف گستردهای از بنچمارکهای آکادمیک، کدنویسی، درک چندوجهی، و حوزهٔ سلامت بهطور معناداری از مدلهای OpenAI o3 و GPT-4o عملکرد بهتری دارد. این برتری هم در سنجشهای بدون ابزار و هم در حالت استفاده از ابزارها دیده میشود، بهویژه در حوزههای ریاضیات رقابتی (AIME 2025 با دقت 94.6٪ بدون ابزار)، مهندسی نرمافزار واقعی (SWE-bench Verified با 74.9٪) و حل مسائل بصری دانشگاهی (MMMU با 84.2٪). GPT-5 همچنین در آزمونهای پیچیدهٔ علمی مانند GPQA و Humanity’s Last Exam، که نیازمند استدلال چندمرحلهای و توانایی پردازش اطلاعات سطحبالا هستند، به نتایج بیسابقهای رسیده است.
در زمینهٔ کدنویسی، GPT-5 بهطور محسوسی نسبت به o3 و 4o دقیقتر و سازگارتر عمل میکند، چه در حل مسائل یکزبانه و چه در ویرایش چندزبانهٔ کد (Aider Polyglot با 88٪). توانایی پیروی از دستورالعملها و استفادهٔ عاملمحور از ابزارها در GPT-5 ارتقاء چشمگیری داشته است، بهطوری که در آزمونهای چندمرحلهای مانند Scale MultiChallenge و BrowseComp، درصد موفقیت بیشتری نسبت به سایر مدلها کسب کرده است. این نشان میدهد که GPT-5 نه تنها میتواند پاسخ دقیق ارائه دهد، بلکه توانایی مدیریت وظایف پیچیده و تغییرپذیر را نیز دارد.
GPT-5 قویترین مدل کدنویسی OpenAI تا امروز است و در تولید رابطهای کاربری پیچیده و دیباگ پروژههای بزرگ عملکرد فوقالعادهای دارد. این مدل میتواند تنها با یک درخواست، وبسایتها، اپلیکیشنها و بازیهایی زیبا، واکنشگرا و با طراحی چشمنواز تولید کند. درک بهتر از فاصلهگذاری، تایپوگرافی و استفاده هوشمندانه از فضای سفید از جمله بهبودهای کلیدی است.
تفسیر تصاویر و نمودار
در حوزهٔ چندوجهی، GPT-5 در بنچمارکهای متنوعی از تفسیر تصاویر و نمودارها تا استدلال علمی و فضایی، پیشتاز بوده است. این مزیت باعث میشود مدل بتواند ورودیهای تصویری را با دقت بالاتری تحلیل کند و کاربردهای عملی گستردهتری در سناریوهایی مانند آموزش، پژوهش، و تحلیل دادههای بصری داشته باشد. برتری در آزمونهایی مانند CharXiv-Reasoning و ERQA نشان میدهد که GPT-5 در درک ساختارهای علمی و روابط فضایی نیز از رقبا پیشی گرفته است.
هوش اقتصادی
بر اساس دادههای ارائهشده، GPT-5 در بنچمارک داخلی OpenAI که برای سنجش عملکرد در وظایف پیچیده و با ارزش اقتصادی طراحی شده، بهترین نتایج را در میان مدلهای موجود کسب کرده است. این ارزیابی طیفی از بیش از 40 حوزهٔ شغلی، از جمله حقوق، لجستیک، فروش و مهندسی را پوشش میدهد.
نتایج نشان میدهد که در حالت استفاده از قابلیت استدلال، GPT-5 در حدود نیمی از موارد با عملکرد کارشناسان انسانی برابری میکند یا حتی از آنها پیشی میگیرد. همچنین، این مدل بهطور پیوسته از OpenAI o3 و ChatGPT Agent عملکرد بهتری داشته است.
مصرف بهینه
دادهها نشان میدهد که GPT-5 در حوزهٔ کارایی بهینه، پردازشی و دقت، نسبت به OpenAI o3 برتری قابلتوجهی دارد. این مدل در آزمونهای متنوع از جمله استدلال بصری، کدنویسی عاملمحور، و حل مسائل علمی در سطح تحصیلات تکمیلی، با استفاده از 50 تا 80 درصد توکن خروجی کمتر به دقت بالاتری میرسد.
پاسخهای قابل اطمینان و درست
از نظر قابلیت اطمینان و صحت، GPT-5 گام بزرگی به جلو برداشته است. با فعال بودن جستجوی وب، پاسخهای این مدل حدود 45٪ کمتر از GPT-4o و تا 80٪ کمتر از OpenAI o3 دچار خطا هستند. در بنچمارکهای متنباز مانند LongFact و FActScore، حالت «با تفکر» در GPT-5 نرخ پاسخ ساختگی را تقریباً شش برابر کمتر از o3 نشان داده است. این پیشرفت بهویژه در تولید محتوای بلند و بازپاسخ اهمیت دارد، جایی که پایداری و صحت اطلاعات نقش کلیدی در اعتماد کاربر ایفا میکند.
علاوه بر دقت، GPT-5 در صداقت پاسخها نیز بهبود یافته است. در آزمایشی که تصاویر ورودی از بنچمارک CharXiv حذف شدند، o3 در 86.7٪ موارد بهطور اطمینانبخش به تصاویر غیرواقعی پاسخ داد، در حالی که GPT-5 تنها در 9٪ موارد چنین پاسخی ارائه کرد. این نشان میدهد که GPT-5 بهتر میتواند محدودیتهای خود را تشخیص دهد و آنها را به کاربر اعلام کند. در سناریوهای عملی برگرفته از ترافیک واقعی ChatGPT، نرخ پاسخهای گمراهکننده از 4.8٪ در o3 به 2.1٪ در GPT-5 کاهش یافته است.
مقایسه ChatGPT-5 با نسخههای قبلی در پاسخ به سوالات
پرسشی که بسیاری از افراد دارند این است که اگر یکی از والدین به سرطان مبتلا شده باشد، آیا احتمال ابتلای فرزند هم بیشتر میشود یا خیر. اما فکر میکنید دو نسخه OpenAI o3 و GPT-5 به این پرسش چه پاسخی دادهاند؟
- سؤال: اگر مادرم سرطان داشته، آیا این موضوع خطر من را افزایش میدهد؟
رویکرد مدل OpenAI o3 بهصورت ساختارمند و خشک تنظیم شده است. این پاسخ با بخشبندی واضح (مانند «چرا اهمیت دارد»، «چه میتوانید انجام دهید» و «جمعبندی») و استفاده از منابع معتبر نظیر Cancer.gov و American Cancer Society، اطلاعات را بهشکل منظم ولی رسمی و جدی بیان میکند. لحن رسمی و فاصلهدار آن، کمتر به ابعاد روانی و عاطفی پرسش کاربر توجه دارد و ممکن است برای مخاطبی که درگیر نگرانی شخصی است، اندکی خشک و غیرشخصی بهنظر برسد.
در مقابل، پاسخ مدل GPT-5 با یک مقدمهی همدلانه آغاز میشود (ابراز ناراحتی برای وجود مشکل) که به کاهش اضطراب مخاطب کمک میکند. این پاسخ از زبان سادهتر و توضیحات مرحلهبهمرحله استفاده میکند و با بیان بایدها و نبایدها و توصیههای عملی، مسیر مشخصی برای اقدامات بعدی ارائه میدهد. مثلا مقدمه GPT-5 برای این پرسش به شرح زیر بود؛
این در حالی است که o3 مسقیما به سراغ پاسخ رفت. پاسخ GPT-5 مزیت اصلیاش همین ترکیب همدلی با سازماندهی شفاف و سادهسازی اطلاعات برای فرد غیرمتخصص است. در حالی که بهصورت حسابشده، بایدها و نبایدها را مشخص میکند تا کاربر بداند چه جزئیاتی میتواند در ادامه برای دقیقتر شدن پاسخ ارائه شود.
در واقع، اگر معیار انتخاب بین پاسخ OpenAI o3 و 4o یا مدلهای مشابه را توانایی در برقراری ارتباط مؤثر با کاربر، کاهش نگرانی، و ایجاد مسیر مشخص برای اقدام بعدی بدانیم، GPT-5 در این سناریو انتخاب منطقیتری است. اما ای طرفی، خیلی به منابع خاصی اشاره نمیکند.
بهبود رویکرد ایمنی (Safety Approach)
در نسخههای قبلی، آموزش ایمنی عمدتاً مبتنی بر رد کردن درخواستهای خطرناک بود. این روش در برابر درخواستهای آشکارا مخرب خوب عمل میکرد اما در موقعیتهایی با نیت مبهم یا حوزههای دوکاربردی (مثل ویروسشناسی) انعطاف کافی نداشت.


در GPT-5، به جای صرفاً رد کردن، از رویکرد «تکمیل ایمن» (Safe Completions) استفاده شده است. مدل یاد میگیرد تا جایی که ممکن است پاسخ مفید ارائه دهد ولی همچنان در محدودهٔ ایمنی باقی بماند. اگر نیاز به رد باشد، دلایل را شفاف میگوید و گزینههای جایگزین امن ارائه میدهد. این باعث شده مدل در برخورد با پرسشهای دوکاربردی دقیقتر و کمتر دچار رد غیرضروری شود.
کاهش جلب توجه و بهبود سبک پاسخگویی (Reducing Sycophancy)
جیپیتی ۵ کمتر از قبل بیشازحد موافق یا به دنبال جلب توجه است و در پیگیری مکالمه، رویکردی ظریفتر و متفکرانهتر دارد. با افزودن نمونههای آموزشی که معمولاً به موافقت بیدلیل منجر میشدند و آموزش مدل برای پرهیز از آنها، نرخ پاسخهای اینچنینی از 14.5٪ به کمتر از 6٪ کاهش یافته است. آن هم بدون افت معنادار در رضایت کاربران. یکی از ویژگیهای جالب توجه در این زمینه، توانایی مدل در تشخیص ناتوانی خود است. به این ترتیب، ChatGPT در مواردی که قادر به انجام کاری نباشد، این موضوع را صادقانه به کاربر اعلام میکند.
قابلیتهای سفارشیسازی بیشتر (Customization)
در کنار این تحولات فنی، OpenAI چهار سبک شخصیتی جدید با نامهای «بدبین» (Cynic)، «رباتیک» (Robot)، «شنونده» (Listener) و «خوره» (Nerd) برای شخصیسازی پاسخها طراحی کرده است. همچنین کاربران میتوانند محیط چت خود را با رنگهای دلخواه سفارشی کنند.
حفاظت در حوزههای پرخطر زیستی و شیمیایی (Biological/Chemical Safeguards)
مدل GPT-5 Thinking بهعنوان یک مدل با توانمندی بالا در حوزههای زیستی و شیمیایی دستهبندی شده است و به همین دلیل، تدابیر حفاظتی قوی و چندلایهای برای کاهش خطرات احتمالی آن در نظر گرفته شده است. این مدل تحت ارزیابیهای ایمنی دقیق و بیش از 5000 ساعت تست امنیتی (Red Teaming) با همکاری نهادهای تخصصی مانند CAISI و UK AISI قرار گرفته است.
اگرچه شواهد قطعی وجود ندارد که این مدل بتواند به افراد کمتجربه در تولید موادی جهت آسیب زیستی جدی کمک کند. اما با رویکردی احتیاطی، تمامی اقدامات حفاظتی لازم فعال شدهاند تا در صورت افزایش توانمندیهای مدل، آمادگی کامل وجود داشته باشد.
نسخهٔ پیشرفته GPT-5 Pro
این نسخه برای وظایف بسیار دشوار، از پردازش موازی و بهینه برای زمان استنتاج استفاده میکند و در آزمونهای علمی و منطقی بسیار پیچیده رکورد زده است. در ارزیابیهای خارجی، GPT-5 Pro در 67.8٪ موارد نسبت به نسخهٔ Thinking برتری داشته، 22٪ خطای عمده کمتری داشته. همچنین در حوزههایی مانند علوم پزشکی، ریاضی و کدنویسی هم عملکرد عالی نشان داده است.
دسترسی به جیپیتی ۵
اگرچه دسترسی به جیپیتی ۵ برای همهی کاربران رایگان است، اما کاربران طرح رایگان با محدودیت نامشخصی در تعداد پرسشها مواجه خواهند شد. پس از رسیدن به این سقف، سیستم به صورت خودکار روی نسخهی ضعیفتری با نام «Mini» قرار میگیرد. در مقابل، مشترکان پلاس میتوانند مدت زمان بیشتری از قابلیتهای کامل GPT-5 استفاده کنند. توسعهدهندگان نیز از طریق API به سه نسخهی GPT-5، GPT-5 nano و GPT-5 mini با قیمتهای متفاوت دسترسی خواهند داشت. همچنین یک نسخهی انحصاری با نام GPT-5 Pro برای مشترکان طرح ماهانه 200 دلاری در نظر گرفته شده است. برای استفاده از GPT-5 روی لینک زیر کلیک کنید؛
منبع: OpenAI
source