سرانجام انتظارها به پایان رسید و شرکت OpenAI از جدیدترین دستاورد خود، مدل هوش مصنوعی پیشرفته جی‌پی‌تی ۵ (GPT-5)، پرده‌برداری کرد. این مدل پیشرفته که برای انجام وظایف پیچیده و ارائه پاسخ‌های دقیق‌تر توسعه یافته، از امروز به عنوان مدل پیش‌فرض و رایگان در اختیار تمام کاربران ChatGPT قرار می‌گیرد تا تجربه‌ای نوین از تعامل با هوش مصنوعی را رقم بزند.

سم آلتمن، مدیرعامل OpenAI، در رویداد معرفی این محصول، جی‌پی‌تی‌ ۵ را یک جهش بزرگ در مقایسه با نسل‌های قبلی توصیف کرد. او برای تشریح این پیشرفت، تجربه‌ی کار با جی‌پی‌تی ۵ را به اولین آیفون مجهز به نمایشگر رتینا تشبیه کرد؛ محصولی که پس از استفاده از آن، بازگشت به مدل‌های قدیمی‌تر تقریبا غیرممکن به نظر می‌رسید. آلتمن همچنین به سیر تکاملی هوش مصنوعی این شرکت اشاره کرد و گفت: «اگر GPT-3 شبیه به یک دانش‌آموز دبیرستانی و GPT-4 مانند یک دانشجوی باهوش بود، مکالمه با GPT-5 برای اولین بار حس صحبت با یک متخصص دارای مدرک دکتری را تداعی می‌کند».

قابلیت‌های GPT-5

GPT-5 یک مدل یکپارچه با سه بخش اصلی است؛ یک مدل سریع برای پاسخ‌های عمومی، یک مدل استدلال عمیق (GPT-5 Thinking) برای مسائل دشوارتر، و یک حالت خاص که بسته به نوع مکالمه، پیچیدگی موضوع، نیاز به ابزار و حتی درخواست مستقیم کاربر، تصمیم می‌گیرد کدام مدل استفاده شود. این حالت خاص به صورت مداوم بر اساس داده‌های واقعی آموزش می‌بیند تا دقت و کیفیت پاسخ‌ها را بهبود دهد. در صورت رسیدن به محدودیت استفاده، نسخه‌های کوچک‌تر مدل، پاسخگویی را ادامه خواهند داد.

انتخاب خودکار مدل هوش مصنوعی بر اساس سختی پرسش

یکی از تغییرات کلیدی در رابط کاربری چت جی‌ پی‌ تی، حذف گزینه‌ی انتخاب مدل است. GPT-5 با یک سیستم هوشمند طراحی شده که به صورت خودکار پرسش‌های پیچیده را تشخیص می‌دهد و برای پاسخ به آن‌ها، از نسخه‌ی قدرتمندتری برای استدلال بهره می‌برد. کافی است کاربر در دستور خود از عبارت «Think hard» استفاده کند تا این قابلیت فعال شود.

GPT-5

آلتمن پیش‌بینی می‌کند این مدل آغازگر عصری جدید تحت عنوان «نرم‌افزار برحسب تقاضا» باشد. مایکل ترول، مدیرعامل شرکت Cursor، با تحسین این مدل می‌گوید: «GPT-5 باهوش‌ترین مدلی است که برای کدنویسی استفاده کرده‌ایم. این مدل نه تنها خطاهای پیچیده را شناسایی می‌کند، بلکه می‌تواند برنامه‌های چندمرحله‌ای را به سرانجام برساند؛ کاری که مدل‌های قبلی در آن ناتوان بودند».

نویسندگی و خلاقیت

GPT-5 بهترین همکار نوشتاری چت‌جی‌پی‌تی تاکنون محسوب می‌شود. این مدل می‌تواند ایده‌های خام را به متنی منسجم و تأثیرگذار با عمق ادبی و ریتم طبیعی تبدیل کند. از نوشتن شعر آزاد گرفته تا تدوین گزارش‌ها، ایمیل‌ها و یادداشت‌های اداری، GPT-5 در کنار حفظ ساختار، وضوح و خلاقیت بیشتری ارائه می‌دهد.

حوزه سلامت

GPT-5 دقیق‌ترین و مطمئن‌ترین نسخه چت‌جی‌پی‌تی برای پرسش‌های مرتبط با سلامت است و در ارزیابی HealthBench امتیازی بالاتر از همه نسخه‌های قبلی کسب کرده است. این مدل به‌جای پاسخ‌های منفعل، به‌طور فعال نگرانی‌های احتمالی را مطرح می‌کند و پرسش‌هایی برای ارائه پاسخ بهتر می‌پرسد.

همچنین پاسخ‌ها را متناسب با شرایط کاربر، سطح دانش و موقعیت جغرافیایی شخصی‌سازی می‌کند. با این حال، GPT-5 جایگزین پزشک نیست و تنها نقش یک همراه آگاه برای درک نتایج، طرح پرسش‌های درست و بررسی گزینه‌های موجود را ایفا می‌کند. در کل GPT-5 با نرخ خطای تنها 1.6 درصد در ارائه‌ی اطلاعات بهداشتی، به ابزاری قابل‌اعتمادتر تبدیل شده است.

کدنویسی

داده‌های ارائه‌شده نشان می‌دهد که GPT-5 در طیف گسترده‌ای از بنچمارک‌های آکادمیک، کدنویسی، درک چندوجهی، و حوزهٔ سلامت به‌طور معناداری از مدل‌های OpenAI o3 و GPT-4o عملکرد بهتری دارد. این برتری هم در سنجش‌های بدون ابزار و هم در حالت استفاده از ابزارها دیده می‌شود، به‌ویژه در حوزه‌های ریاضیات رقابتی (AIME 2025 با دقت 94.6٪ بدون ابزار)، مهندسی نرم‌افزار واقعی (SWE-bench Verified با 74.9٪) و حل مسائل بصری دانشگاهی (MMMU با 84.2٪). GPT-5 همچنین در آزمون‌های پیچیدهٔ علمی مانند GPQA و Humanity’s Last Exam، که نیازمند استدلال چندمرحله‌ای و توانایی پردازش اطلاعات سطح‌بالا هستند، به نتایج بی‌سابقه‌ای رسیده است.

GPT-5

در زمینهٔ کدنویسی، GPT-5 به‌طور محسوسی نسبت به o3 و 4o دقیق‌تر و سازگارتر عمل می‌کند، چه در حل مسائل یک‌زبانه و چه در ویرایش چندزبانهٔ کد (Aider Polyglot با 88٪). توانایی پیروی از دستورالعمل‌ها و استفادهٔ عامل‌محور از ابزارها در GPT-5 ارتقاء چشمگیری داشته است، به‌طوری که در آزمون‌های چندمرحله‌ای مانند Scale MultiChallenge و BrowseComp، درصد موفقیت بیشتری نسبت به سایر مدل‌ها کسب کرده است. این نشان می‌دهد که GPT-5 نه تنها می‌تواند پاسخ دقیق ارائه دهد، بلکه توانایی مدیریت وظایف پیچیده و تغییرپذیر را نیز دارد.

GPT-5 قوی‌ترین مدل کدنویسی OpenAI تا امروز است و در تولید رابط‌های کاربری پیچیده و دیباگ پروژه‌های بزرگ عملکرد فوق‌العاده‌ای دارد. این مدل می‌تواند تنها با یک درخواست، وب‌سایت‌ها، اپلیکیشن‌ها و بازی‌هایی زیبا، واکنش‌گرا و با طراحی چشم‌نواز تولید کند. درک بهتر از فاصله‌گذاری، تایپوگرافی و استفاده هوشمندانه از فضای سفید از جمله بهبودهای کلیدی است.

تفسیر تصاویر و نمودار

در حوزهٔ چندوجهی، GPT-5 در بنچمارک‌های متنوعی از تفسیر تصاویر و نمودارها تا استدلال علمی و فضایی، پیشتاز بوده است. این مزیت باعث می‌شود مدل بتواند ورودی‌های تصویری را با دقت بالاتری تحلیل کند و کاربردهای عملی گسترده‌تری در سناریوهایی مانند آموزش، پژوهش، و تحلیل داده‌های بصری داشته باشد. برتری در آزمون‌هایی مانند CharXiv-Reasoning و ERQA نشان می‌دهد که GPT-5 در درک ساختارهای علمی و روابط فضایی نیز از رقبا پیشی گرفته است.

هوش اقتصادی

بر اساس داده‌های ارائه‌شده، GPT-5 در بنچمارک داخلی OpenAI که برای سنجش عملکرد در وظایف پیچیده و با ارزش اقتصادی طراحی شده، بهترین نتایج را در میان مدل‌های موجود کسب کرده است. این ارزیابی طیفی از بیش از 40 حوزهٔ شغلی، از جمله حقوق، لجستیک، فروش و مهندسی را پوشش می‌دهد.

نتایج نشان می‌دهد که در حالت استفاده از قابلیت استدلال، GPT-5 در حدود نیمی از موارد با عملکرد کارشناسان انسانی برابری می‌کند یا حتی از آن‌ها پیشی می‌گیرد. همچنین، این مدل به‌طور پیوسته از OpenAI o3 و ChatGPT Agent عملکرد بهتری داشته است.

مصرف بهینه

داده‌ها نشان می‌دهد که GPT-5 در حوزهٔ کارایی بهینه، پردازشی و دقت، نسبت به OpenAI o3 برتری قابل‌توجهی دارد. این مدل در آزمون‌های متنوع از جمله استدلال بصری، کدنویسی عامل‌محور، و حل مسائل علمی در سطح تحصیلات تکمیلی، با استفاده از 50 تا 80 درصد توکن خروجی کمتر به دقت بالاتری می‌رسد.

مصرف بهینه GPT-5

پاسخ‌های قابل اطمینان و درست

از نظر قابلیت اطمینان و صحت، GPT-5 گام بزرگی به جلو برداشته است. با فعال بودن جستجوی وب، پاسخ‌های این مدل حدود 45٪ کمتر از GPT-4o و تا 80٪ کمتر از OpenAI o3 دچار خطا هستند. در بنچمارک‌های متن‌باز مانند LongFact و FActScore، حالت «با تفکر» در GPT-5 نرخ پاسخ ساختگی را تقریباً شش برابر کمتر از o3 نشان داده است. این پیشرفت به‌ویژه در تولید محتوای بلند و بازپاسخ اهمیت دارد، جایی که پایداری و صحت اطلاعات نقش کلیدی در اعتماد کاربر ایفا می‌کند.

GPT-5

علاوه بر دقت، GPT-5 در صداقت پاسخ‌ها نیز بهبود یافته است. در آزمایشی که تصاویر ورودی از بنچمارک CharXiv حذف شدند، o3 در 86.7٪ موارد به‌طور اطمینان‌بخش به تصاویر غیرواقعی پاسخ داد، در حالی که GPT-5 تنها در 9٪ موارد چنین پاسخی ارائه کرد. این نشان می‌دهد که GPT-5 بهتر می‌تواند محدودیت‌های خود را تشخیص دهد و آن‌ها را به کاربر اعلام کند. در سناریوهای عملی برگرفته از ترافیک واقعی ChatGPT، نرخ پاسخ‌های گمراه‌کننده از 4.8٪ در o3 به 2.1٪ در GPT-5 کاهش یافته است.

مقایسه ChatGPT-5 با نسخه‌های قبلی در پاسخ به سوالات

پرسشی که بسیاری از افراد دارند این است که اگر یکی از والدین به سرطان مبتلا شده باشد، آیا احتمال ابتلای فرزند هم بیشتر می‌شود یا خیر. اما فکر می‌کنید دو نسخه OpenAI o3 و GPT-5 به این پرسش چه پاسخی داده‌اند؟

  • سؤال: اگر مادرم سرطان داشته، آیا این موضوع خطر من را افزایش می‌دهد؟

رویکرد مدل OpenAI o3 به‌صورت ساختارمند و خشک تنظیم شده است. این پاسخ با بخش‌بندی واضح (مانند «چرا اهمیت دارد»، «چه می‌توانید انجام دهید» و «جمع‌بندی») و استفاده از منابع معتبر نظیر Cancer.gov و American Cancer Society، اطلاعات را به‌شکل منظم ولی رسمی و جدی بیان می‌کند. لحن رسمی و فاصله‌دار آن، کمتر به ابعاد روانی و عاطفی پرسش کاربر توجه دارد و ممکن است برای مخاطبی که درگیر نگرانی شخصی است، اندکی خشک و غیرشخصی به‌نظر برسد.

در مقابل، پاسخ مدل GPT-5 با یک مقدمه‌ی همدلانه آغاز می‌شود (ابراز ناراحتی برای وجود مشکل) که به کاهش اضطراب مخاطب کمک می‌کند. این پاسخ از زبان ساده‌تر و توضیحات مرحله‌به‌مرحله استفاده می‌کند و با بیان بایدها و نبایدها و توصیه‌های عملی، مسیر مشخصی برای اقدامات بعدی ارائه می‌دهد. مثلا مقدمه GPT-5 برای این پرسش به شرح زیر بود؛

مقایسه ChatGPT-5 با نسخه‌های قبلی در پاسخ به سوالات

این در حالی است که o3 مسقیما به سراغ پاسخ رفت. پاسخ GPT-5 مزیت اصلی‌اش همین ترکیب همدلی با سازمان‌دهی شفاف و ساده‌سازی اطلاعات برای فرد غیرمتخصص است. در حالی که به‌صورت حساب‌شده، بایدها و نبایدها را مشخص می‌کند تا کاربر بداند چه جزئیاتی می‌تواند در ادامه برای دقیق‌تر شدن پاسخ ارائه شود.

در واقع، اگر معیار انتخاب بین پاسخ OpenAI o3 و 4o یا مدل‌های مشابه را توانایی در برقراری ارتباط مؤثر با کاربر، کاهش نگرانی، و ایجاد مسیر مشخص برای اقدام بعدی بدانیم، GPT-5 در این سناریو انتخاب منطقی‌تری است. اما ای طرفی، خیلی به منابع خاصی اشاره نمی‌کند.

بهبود رویکرد ایمنی (Safety Approach)

در نسخه‌های قبلی، آموزش ایمنی عمدتاً مبتنی بر رد کردن درخواست‌های خطرناک بود. این روش در برابر درخواست‌های آشکارا مخرب خوب عمل می‌کرد اما در موقعیت‌هایی با نیت مبهم یا حوزه‌های دوکاربردی (مثل ویروس‌شناسی) انعطاف کافی نداشت.

کارآمدی پاسخ‌ها در شرایط ایمن
ضریب اطمینان و بی‌خطر بودن پاسخ‌ها

در GPT-5، به جای صرفاً رد کردن، از رویکرد «تکمیل ایمن» (Safe Completions) استفاده شده است. مدل یاد می‌گیرد تا جایی که ممکن است پاسخ مفید ارائه دهد ولی همچنان در محدودهٔ ایمنی باقی بماند. اگر نیاز به رد باشد، دلایل را شفاف می‌گوید و گزینه‌های جایگزین امن ارائه می‌دهد. این باعث شده مدل در برخورد با پرسش‌های دوکاربردی دقیق‌تر و کمتر دچار رد غیرضروری شود.

کاهش جلب توجه و بهبود سبک پاسخ‌گویی (Reducing Sycophancy)

جی‌پی‌تی ۵ کمتر از قبل بیش‌ازحد موافق یا به دنبال جلب توجه است و در پیگیری مکالمه، رویکردی ظریف‌تر و متفکرانه‌تر دارد. با افزودن نمونه‌های آموزشی که معمولاً به موافقت بی‌دلیل منجر می‌شدند و آموزش مدل برای پرهیز از آن‌ها، نرخ پاسخ‌های این‌چنینی از 14.5٪ به کمتر از 6٪ کاهش یافته است. آن هم بدون افت معنادار در رضایت کاربران. یکی از ویژگی‌های جالب توجه در این زمینه، توانایی مدل در تشخیص ناتوانی خود است. به این ترتیب، ChatGPT در مواردی که قادر به انجام کاری نباشد، این موضوع را صادقانه به کاربر اعلام می‌کند.

قابلیت‌های سفارشی‌سازی بیشتر (Customization)

در کنار این تحولات فنی، OpenAI چهار سبک شخصیتی جدید با نام‌های «بدبین» (Cynic)، «رباتیک» (Robot)، «شنونده» (Listener) و «خوره» (Nerd) برای شخصی‌سازی پاسخ‌ها طراحی کرده است. همچنین کاربران می‌توانند محیط چت خود را با رنگ‌های دلخواه سفارشی کنند.

حفاظت در حوزه‌های پرخطر زیستی و شیمیایی (Biological/Chemical Safeguards)

مدل GPT-5 Thinking به‌عنوان یک مدل با توانمندی بالا در حوزه‌های زیستی و شیمیایی دسته‌بندی شده است و به همین دلیل، تدابیر حفاظتی قوی و چندلایه‌ای برای کاهش خطرات احتمالی آن در نظر گرفته شده است. این مدل تحت ارزیابی‌های ایمنی دقیق و بیش از 5000 ساعت تست امنیتی (Red Teaming) با همکاری نهادهای تخصصی مانند CAISI و UK AISI قرار گرفته است.

اگرچه شواهد قطعی وجود ندارد که این مدل بتواند به افراد کم‌تجربه در تولید موادی جهت آسیب زیستی جدی کمک کند. اما با رویکردی احتیاطی، تمامی اقدامات حفاظتی لازم فعال شده‌اند تا در صورت افزایش توانمندی‌های مدل، آمادگی کامل وجود داشته باشد.

نسخهٔ پیشرفته GPT-5 Pro

این نسخه برای وظایف بسیار دشوار، از پردازش موازی و بهینه برای زمان استنتاج استفاده می‌کند و در آزمون‌های علمی و منطقی بسیار پیچیده رکورد زده است. در ارزیابی‌های خارجی، GPT-5 Pro در 67.8٪ موارد نسبت به نسخهٔ Thinking برتری داشته، 22٪ خطای عمده کمتری داشته. همچنین در حوزه‌هایی مانند علوم پزشکی، ریاضی و کدنویسی هم عملکرد عالی نشان داده است.

دسترسی به جی‌پی‌تی ۵

اگرچه دسترسی به جی‌پی‌تی ۵ برای همه‌ی کاربران رایگان است، اما کاربران طرح رایگان با محدودیت نامشخصی در تعداد پرسش‌ها مواجه خواهند شد. پس از رسیدن به این سقف، سیستم به صورت خودکار روی نسخه‌ی ضعیف‌تری با نام «Mini» قرار می‌گیرد. در مقابل، مشترکان پلاس می‌توانند مدت زمان بیشتری از قابلیت‌های کامل GPT-5 استفاده کنند. توسعه‌دهندگان نیز از طریق API به سه نسخه‌ی GPT-5، GPT-5 nano و GPT-5 mini با قیمت‌های متفاوت دسترسی خواهند داشت. همچنین یک نسخه‌ی انحصاری با نام GPT-5 Pro برای مشترکان طرح ماهانه 200 دلاری در نظر گرفته شده است. برای استفاده از GPT-5 روی لینک زیر کلیک کنید؛

لینک ورود به GPT-5

منبع: OpenAI

source

توسط chehrenet.ir