شرکت OpenAI در واکنش به انتقادات گسترده کاربران، بهروزرسانی بحثبرانگیز مدل GPT-4o را که به تازگی برای ChatGPT منتشر کرده بود، متوقف کرد. کاربران گزارش داده بودند که پس از این آپدیت، هوش مصنوعی رفتاری غیرطبیعی، بیش از حد تملقآمیز و حتی آزاردهنده پیدا کرده است. این تغییرات بهسرعت در شبکههای اجتماعی بازتاب یافت و بسیاری با انتشار اسکرینشاتهایی، موافقت بیچونوچرای چت جیپیتی با ایدهها و تصمیمات نادرست یا حتی خطرناک را به سخره گرفتند.
هدف اصلی OpenAI از این بهروزرسانی، بهبود جنبههای مربوط به «هوش و شخصیت» مدل GPT-4o بود تا تعاملات طبیعیتر و کارآمدتری را برای کاربران فراهم کند. با این حال، به نظر میرسد اتکای بیش از حد به بازخوردهای کوتاهمدت کاربران و نادیده گرفتن تاثیر تعاملات بلندمدت، نتیجهای معکوس به همراه داشت. این رویکرد باعث شد مدل به جای ارائه پاسخهای صادقانه و متعادل، تمایل شدیدی به تایید هرگونه ورودی از سوی کاربر پیدا کند و شخصیتی چاپلوس و غیرقابل اعتماد از خود نشان دهد.
سم آلتمن، مدیرعامل OpenAI، از طریق پستی در شبکه اجتماعی ایکس (توییتر سابق) این موضوع را تایید کرد. او اعلام کرد که بهروزرسانی اخیر GPT-4o لغو شده و ChatGPT به وضعیت پیشین خود بازگشته است. آلتمن همچنین قول داد که تیم توسعهدهنده روی اصلاحات بیشتری کار خواهد کرد تا شخصیت این هوش مصنوعی در آینده بهبود پیدا کند و از بروز چنین مشکلاتی جلوگیری شود. OpenAI پذیرفت که در طراحی این بهروزرسانی اشتباهی رخ داده و ساختار مدل جدید بهگونهای شکل گرفته بود که صداقت آن را تحتالشعاع قرار میداد؛ رفتاری که میتوانست برای کاربران ناخوشایند یا حتی در مواردی مضر باشد.
این شرکت تاکید کرد که از این تجربه درسهای مهمی آموخته و در حال بازبینی روشهای آموزشی مدلها و همچنین دستورهای سیستمی خود است. یکی از اهداف کلیدی، تقویت سیستمهای ایمنی برای پیشگیری از تکرار چنین رفتارهای نامطلوبی در مدلهای زبانی آینده محسوب میشود.
علاوه بر این، OpenAI برنامههایی برای افزایش کنترل کاربران بر تجربه خود از ChatGPT دارد. این شرکت در حال آزمایش روشهایی است که به کاربران امکان میدهد بازخوردهای لحظهای خود را حین گفتگو با چتبات ثبت کنند. همچنین، گزینهای برای انتخاب از میان شخصیتهای مختلف برای ChatGPT در دست بررسی قرار دارد تا کاربران بتوانند تجربهای شخصیسازیشدهتر داشته باشند. OpenAI امیدوار است با در نظر گرفتن بازخوردهای فرهنگی و دموکراتیک در طراحی رفتار پیشفرض مدل، تعاملات آینده با ChatGPT را بهبود بخشد و اطمینان حاصل کند که رفتار این هوش مصنوعی با انتظارات و هنجارهای جوامع مختلف سازگاری بیشتری دارد. هدف نهایی، دستیابی به تعادل بهتری میان هوش، شخصیت و صداقت در ChatGPT و ارائه تجربهای مفیدتر و قابلاعتمادتر برای همه کاربران در سراسر جهان است.
منبع: arstechnica
source