گوگل دیپ‌مایند با معرفی مدل هوش مصنوعی جدید خود با نام Genie 3، توجه‌ها را به سمت نسل تازه‌ای از دنیاهای مجازی جلب کرده است. این مدل پیشرفته قادر است دنیاهای سه‌بعدی تعاملی را به صورت آنی و تنها بر اساس یک تصویر یا دستور متنی ایجاد کند. Genie 3 در واقع یک «مدل جهانی» (World Model) محسوب می‌شود؛ این مدل‌ها محیط‌های مجازی را با هدف سرگرمی، ساخت بازی‌های ویدیویی یا مهم‌تر از آن، آموزش و ارزیابی سیستم‌های هوشمند دیگر شبیه‌سازی می‌کنند.

این دستاورد جدید گوگل دیپ‌مایند، یک ارتقای قابل‌توجه نسبت به نسل قبلی خود یعنی Genie 2 به شمار می‌رود. Genie 3 می‌تواند دنیاهای مجازی را با رزولوشن 720p و برای مدتی طولانی‌تر، یعنی چندین دقیقه، پایدار نگه دارد. این در حالی است که نسل پیشین به رزولوشن 360p و پایداری حداکثر یک دقیقه‌ای محدود بود. یکی از مهم‌ترین پیشرفت‌های این مدل هوش مصنوعی گوگل، پاسخ‌گویی آنی به دستورات است؛ به این معنا که دیگر برای تولید هر فریم نیازی به صرف زمان نیست و تعامل با محیط مجازی به صورت زنده انجام می‌شود.

یکی از برجسته‌ترین قابلیت‌های Genie 3 که دیپ‌مایند آن را «رویدادهای جهانی قابل‌برنامه‌ریزی» (Promptable World Events) می‌نامد، به محققان اجازه می‌دهد تا با دستورات متنی ساده، دنیای شبیه‌سازی‌شده را در لحظه تغییر دهند. برای مثال، در ویدیوی معرفی این مدل، یک کاربر در حال اسکی در کوهستان است و محققان با یک دستور متنی، گله‌ای گوزن را به صحنه اضافه می‌کنند. این ویژگی، Genie 3 را به یک زمین بازی بی‌پایان برای آموزش عامل‌های هوشمند تبدیل می‌کند.

محققان می‌توانند سناریوهای «چه می‌شد اگر» را که اجرای آنها در دنیای واقعی خطرناک یا پرهزینه است، شبیه‌سازی کنند. به گفته‌ی مدیر تحقیقات دیپ‌مایند، می‌توان از این مدل برای آموزش یک خودروی خودران جهت جلوگیری از برخورد با عابری که ناگهان وارد خیابان می‌شود، استفاده کرد. با این حال، Genie 3 هنوز در مراحل ابتدایی توسعه قرار دارد و در مواردی مانند رندر کردن متن یا شبیه‌سازی دقیق قوانین فیزیک با چالش‌هایی روبرو است.

منبع: DeepMind

source

توسط chehrenet.ir