گوگل دیپمایند با معرفی مدل هوش مصنوعی جدید خود با نام Genie 3، توجهها را به سمت نسل تازهای از دنیاهای مجازی جلب کرده است. این مدل پیشرفته قادر است دنیاهای سهبعدی تعاملی را به صورت آنی و تنها بر اساس یک تصویر یا دستور متنی ایجاد کند. Genie 3 در واقع یک «مدل جهانی» (World Model) محسوب میشود؛ این مدلها محیطهای مجازی را با هدف سرگرمی، ساخت بازیهای ویدیویی یا مهمتر از آن، آموزش و ارزیابی سیستمهای هوشمند دیگر شبیهسازی میکنند.
این دستاورد جدید گوگل دیپمایند، یک ارتقای قابلتوجه نسبت به نسل قبلی خود یعنی Genie 2 به شمار میرود. Genie 3 میتواند دنیاهای مجازی را با رزولوشن 720p و برای مدتی طولانیتر، یعنی چندین دقیقه، پایدار نگه دارد. این در حالی است که نسل پیشین به رزولوشن 360p و پایداری حداکثر یک دقیقهای محدود بود. یکی از مهمترین پیشرفتهای این مدل هوش مصنوعی گوگل، پاسخگویی آنی به دستورات است؛ به این معنا که دیگر برای تولید هر فریم نیازی به صرف زمان نیست و تعامل با محیط مجازی به صورت زنده انجام میشود.
یکی از برجستهترین قابلیتهای Genie 3 که دیپمایند آن را «رویدادهای جهانی قابلبرنامهریزی» (Promptable World Events) مینامد، به محققان اجازه میدهد تا با دستورات متنی ساده، دنیای شبیهسازیشده را در لحظه تغییر دهند. برای مثال، در ویدیوی معرفی این مدل، یک کاربر در حال اسکی در کوهستان است و محققان با یک دستور متنی، گلهای گوزن را به صحنه اضافه میکنند. این ویژگی، Genie 3 را به یک زمین بازی بیپایان برای آموزش عاملهای هوشمند تبدیل میکند.
محققان میتوانند سناریوهای «چه میشد اگر» را که اجرای آنها در دنیای واقعی خطرناک یا پرهزینه است، شبیهسازی کنند. به گفتهی مدیر تحقیقات دیپمایند، میتوان از این مدل برای آموزش یک خودروی خودران جهت جلوگیری از برخورد با عابری که ناگهان وارد خیابان میشود، استفاده کرد. با این حال، Genie 3 هنوز در مراحل ابتدایی توسعه قرار دارد و در مواردی مانند رندر کردن متن یا شبیهسازی دقیق قوانین فیزیک با چالشهایی روبرو است.
منبع: DeepMind
source