شرکت OpenAI با معرفی مدل o3-pro، گامی مهم در مسیر توسعهی هوش مصنوعی برداشته و آن را به عنوان توانمندترین مدل خود تا به امروز معرفی کرده است. این مدل در واقع نسخه پیشرفتهتری از o3 به حساب میآید که پیشتر در سال جاری میلادی عرضه شده بود. تفاوت اصلی o3-pro با مدلهای هوش مصنوعی متداول، در توانایی آن برای «استدلال» نهفته است. این مدلها به جای ارائه پاسخهای فوری، مسائل را به صورت گامبهگام تحلیل و حل میکنند. همین ویژگی باعث شده است تا در حوزههایی که به دقت بالایی نیاز دارند، مانند ریاضیات، فیزیک و برنامهنویسی، عملکردی بسیار قابلاطمینان از خود به نمایش بگذارند.
دسترسی به این مدل جدید از روز سهشنبه برای کاربران اشتراکهای ChatGPT Pro و Team فراهم شده و جایگزین مدل o1-pro میشود. طبق اعلام OpenAI، کاربران نسخههای Enterprise و Edu نیز از هفته آینده میتوانند از قابلیتهای o3-pro بهرهمند شوند. همچنین توسعهدهندگان از طریق API شرکت به این مدل دسترسی کامل دارند.
از نظر هزینهها، OpenAI برای استفاده از o3-pro در API خود تعرفههای مشخصی را اعلام کرده است. هزینه هر یک میلیون توکن ورودی برابر با 20 دلار و هزینه هر یک میلیون توکن خروجی 80 دلار تعیین شده است. توکنهای ورودی همان دادههایی هستند که به مدل ارائه میشوند و توکنهای خروجی، پاسخهایی هستند که مدل بر اساس ورودیها تولید میکند. برای درک بهتر این مقیاس، میتوان گفت یک میلیون توکن ورودی تقریبا معادل 750,000 کلمه است که حجمی بیشتر از رمان مشهور «جنگ و صلح» را شامل میشود.
OpenAI در گزارش تغییرات خود تاکید میکند که در ارزیابیهای تخصصی، بازبینها به طور مداوم o3-pro را به مدل o3 ترجیح دادهاند. این برتری در تمامی دستهبندیهای مورد آزمایش، به ویژه در زمینههای کلیدی مانند علوم، آموزش، برنامهنویسی، کسبوکار و کمک به نویسندگی، کاملا مشهود بوده است. علاوه بر این، o3-pro در معیارهایی نظیر وضوح، جامعیت، پیروی از دستورالعملها و دقت نیز امتیازات بالاتری کسب کرده است.
یکی از نقاط قوت o3-pro، دسترسی آن به مجموعهای از ابزارهای کاربردی است. این مدل میتواند در اینترنت جستجو کند، فایلها را تحلیل کند، ورودیهای تصویری را درک و تفسیر کند، از زبان پایتون برای محاسبات استفاده کند و با بهرهگیری از حافظه، پاسخهای خود را شخصیسازی کند. البته این توانمندیها با یک نقطه ضعف همراه است؛ طبق گفتهی OpenAI، زمان لازم برای تولید پاسخ در o3-pro معمولا طولانیتر از o1-pro است. این شرکت معتقد است این زمان بیشتر، هزینهای است که برای دستیابی به دقت و اطمینان بالاتر پرداخت میشود.
این مدل محدودیتهایی نیز دارد. قابلیت چتهای موقت در چت جیپیتی با o3-pro به دلیل یک مشکل فنی فعلا غیرفعال است. همچنین این مدل توانایی تولید تصویر را ندارد و با ابزار Canvas، فضای کاری هوشمند OpenAI، سازگار نیست. با این حال، در بنچمارکهای معتبر هوش مصنوعی، o3-pro نتایج درخشانی به دست آورده است. در آزمون AIME 2024 که مهارتهای ریاضی مدلها را میسنجد، o3-pro عملکرد بهتری نسبت به مدل قدرتمند Gemini 2.5 Pro از گوگل داشته است. این مدل همچنین در آزمون GPQA Diamond که دانش علمی در سطح دکترا را ارزیابی میکند، از مدل Claude 4 Opus شرکت Anthropic پیشی گرفته است.
منبع: TechCrunch
source