انویدیا از یک سرویس نوآورانه پردهبرداری کرده که مسیری تازه پیش روی توسعهدهندگان برای تولید تصاویر با هوش مصنوعی باز میکند. این فناوری جدید به کاربران امکان میدهد صحنههای سهبعدی را به عنوان راهنما به کار بگیرند و تصاویر دوبعدی دقیق و پرجزئیاتی خلق کنند. نام رسمی این ابزار Nvidia AI Blueprint for 3D-guided generative AI انتخاب شده و از همین امروز علاقهمندان میتوانند آن را دانلود کنند. البته استفاده از این سرویس نیازمند پیشنیاز سختافزاری قابل توجهی است؛ کاربران باید به کارت گرافیک قدرتمند RTX 4080 یا مدلی بالاتر از آن مجهز باشند.
عملکرد این سرویس بر پایهی همکاری دو ابزار کلیدی شکل گرفته است: نرمافزار محبوب مدلسازی سهبعدی Blender و ابزار تولید تصویر مبتنی بر هوش مصنوعی FLUX.1 که توسط شرکت Black Forest Lab توسعه یافته. طبق توضیحات منتشر شده از سوی انویدیا، کاربران ابتدا باید یک صحنه اولیه را در محیط Blender طراحی کنند. این صحنه میتواند شامل اشیای سهبعدی مختلفی مانند ساختمانها، عناصر طبیعی مثل گیاهان، فیگورهای حیوانات و انواع وسایل نقلیه باشد. نکته جالب توجه اینجاست که مدلهای سهبعدی مورد استفاده لزوما نیازی به جزئیات بالا یا پرداخت دقیق ندارند و تنها به عنوان یک راهنمای کلی برای هوش مصنوعی عمل میکنند.
پس از آمادهسازی صحنه در Blender، سرویس جدید انویدیا وارد عمل میشود. این ابزار طرح سهبعدی را به عنوان یک مرجع یا نقشه راه برای هوش مصنوعی FLUX.1 در نظر میگیرد تا تصویر دوبعدی نهایی را بر اساس آن تولید کند. مزیت اصلی این رویکرد در مقایسه با روشهای متداول تولید تصویر با هوش مصنوعی که صرفا بر دستورات متنی تکیه دارند، کنترل بسیار دقیقتر بر نتیجه نهایی است. کاربران میتوانند به صورت دستی موقعیت دوربین یا زاویه دید را تنظیم کنند و محل قرارگیری تک تک اشیا را مشخص نمایند تا جزئیات تصویر دقیقا همان چیزی باشد که در ذهن دارند.
برای مثال، تصور کنید قصد دارید تصویری از یک منظره شهری خاص ایجاد کنید. با استفاده از این سرویس، میتوانید ابتدا در Blender طرح کلی شهر را بسازید؛ شکل و ارتفاع ساختمانها را تعیین کنید، تعداد و محل درختان و خودروها را مشخص نمایید و حتی زاویه نگاه به صحنه را تنظیم کنید. سپس هوش مصنوعی FLUX.1 با دریافت این راهنمای سهبعدی، تصویری دوبعدی خلق میکند که به مراتب به تصورات ذهنی شما نزدیکتر خواهد بود تا تصاویری که صرفا با یک پرامپت متنی تولید میشوند.
انویدیا این سرویس جدید را بیشتر به عنوان یک جعبهابزار برای توسعهدهندگان معرفی میکند که قصد دارند اپلیکیشنهای خلاقانه مبتنی بر هوش مصنوعی بسازند. به همین منظور، این بسته نرمافزاری همراه با مستندات کامل و راهنماهای گامبهگام، چندین نمونهی از پیش آماده و یک محیط توسعهی پیکربندی شده عرضه میشود تا کار توسعهدهندگان را سادهتر کند.
باید اشاره کرد که انویدیا اولین شرکتی نیست که به فکر ترکیب راهنمای سهبعدی و هوش مصنوعی مولد افتاده است. شرکت ادوبی نیز مدتی پیش از پروژهای مشابه با نام Project Concept رونمایی کرد. با این حال، ابزار ادوبی هنوز در مراحل اولیه و آزمایشی قرار دارد و مشخص نیست چه زمانی یا حتی آیا اصلا به صورت عمومی منتشر خواهد شد یا نه. در مقابل، سرویس انویدیا همین حالا در دسترس کاربران واجد شرایط قرار گرفته است. این دسترسی فوری میتواند برگ برنده مهمی برای انویدیا در این حوزه نوظهور باشد.
منبع: The Verge
source