هوش مصنوعی لئوناردو (Leonardo AI) و فری پیک (Freepik) دو نمونه از معتبرترین تولیدکننده‌های تصویر مبتنی بر هوش مصنوعی در بازار هستند. هر دو شرکت شهرت خوبی در تبدیل متن به تصاویر باکیفیت دارند، اگرچه رویکردهای آن‌ها در انجام این کار به طور قابل توجهی با یکدیگر متفاوت است. هدف از این مقاله مقایسه لئوناردو و فری پیک از نظر کیفیت و تنوع عملکرد آن‌هاست تا مشخص شود کدام سرویس برای کاربران انتخاب بهتری است.

در حالی که فری پیک مجموعه‌ای نسبتاً استاندارد از خدمات تولید تصویر ارائه می‌دهد، لئوناردو به یک پلتفرم گسترده در زمینه منابع تصویری تبدیل شده که همه چیز از طراحی و قالب‌بندی گرفته تا ساخت ویدیو را در بر می‌گیرد. یکی از نکات جالب در مورد فری پیک این است که علاوه بر مدل‌های اختصاصی، امکان تولید تصویر از طریق مدل‌های شخص ثالث نظیر ایدئوگرام (Ideogram) و گوگل ایمجن (Google Imagen 3) را هم فراهم می‌کند؛ البته باید گفت استفاده از این مدل هوش مصنوعی رایگان نیست. از سوی دیگر، لئوناردو هم تصاویر را با استفاده از مدل‌هایی از هوش مصنوعی مانند فلاکس (Flux) و استیبل دیفیوژن (Stable Diffusion) ارائه می‌دهد، اما تمرکز بیشتری بر سبک‌های تصویری دارد. این تفاوت در استفاده از مدل‌های مختلف هوش مصنوعی ساخت عکس در عمل نتایج جالبی را در مقایسه لئوناردو و فری پیک به همراه دارد.

برای این مقایسه پنج پرامپت یا دستور متنی در زمینه‌های مختلف به هر دو این هوش مصنوعی‌ها داده شده است، که عبارت‌اند از: طراحی یک محیط فانتزی، طراحی صحنه‌ای از طبیعت، طراحی انتزاعی، تولید تصویر به سبک فوتورئالیستی و طراحی متنی و تایپوگرافی.

آزمایش اول در مقایسه لئوناردو و فری پیک: طراحی متنی و تایپوگرافی

پرامپت:

«آپارتمانی مدرن در پاریس را به نمایش بگذار، با منظره‌ای تماشایی از شهر، مبلمان مینیمالیستی، با استفاده از متریال‌های کروم و فولاد با ظاهری گران‌قیمت. یک تابلوی نقاشی مدرن و گران‌قیمت بر روی دیوار نصب کن و یک شیء تزئینی از فولاد ضدزنگ با نوشته‌ “Peace” (صلح) را در محیط آپارتمان قرار بده»

Prompt: “A stylish modern penthouse apartment in Paris, with a spectacular view of the city. Modern minimalist furniture, chrome and steel with an expensive look. One expensive modern painting on the wall, and a small stainless steel bauble which is the word ‘Peace’.”

نتیجه لئوناردو

نتیجه آزمایش اول هوش مصنوعی لئوناردو در طراحی متنی و تایپوگرافی

نتیجه آزمایش اول هوش مصنوعی لئوناردو در طراحی متنی و تایپوگرافی

تصویری که توسط برنامه هوش مصنوعی لئوناردو تولید شده، به وضوح مینیمال و شیک است. با توجه به برج ایفل در پس‌زمینه، محل آپارتمان به درستی در پاریس قرار دارد و در نتیجه مطابقت آن با پرامپت داده شده عالی ارزیابی می‌شود. تنها ایراد موجود این است که کلمه “Peace” (صلح) به طور واضح در تصویر دیده نمی‌شود. با وجود چندین بار تلاشی که برای تولید این تصویر انجام شده است، این نتیجه بهترین نمونه‌ ممکن از تولیداتی که لئوناردو ارائه داده بود است. بنابراین می‌توان نتیجه گرفت که نقطه ضعف  لئوناردو در بازنمایی متن است؛ چیزی که اساسا این آزمایش برای آن طراحی شده است.

نتیجه فری پیک

نتیجه آزمایش اول هوش مصنوعی فری پیک در طراحی متنی و تایپوگرافی

نتیجه آزمایش اول هوش مصنوعی فری پیک در طراحی متنی و تایپوگرافی

اولین واکنشی که می‌توان پس از دیدن تصویر تولیدشده توسط فری پیک داشت، حیرت و تحسین است. در تولید این تصویر از مدل میستیک ۲.۵ فلکسیبل (Mystic 2.5 Flexible) استفاده شده و همان‌طور که می‌بینید نتیجه‌ای چشمگیر به دست آمده است. هوش مصنوعی فری پیک تصویر را تنها در یک مرحله تولید کرد و از مطابقت آن با متن داده شده گرفته تا ساختار کلی تصویر، همه چیز تقریباً بی‌نقص است. بدون اغراق این تصویر یکی از بهترین خروجی‌هایی‌ است که تاکنون از یک تولیدکننده تصویر هوش مصنوعی مشاهده شده و شاید فقط بتوان عملکرد میدجورنی (Midjourney) را در سطح آن دانست.

برنده آزمایش اول: فری پیک

ویرایش عکس با هوش مصنوعی

آزمایش دوم: تولید تصویر به سبک فوتورئالیستی

پرامپت:

«میز یک نگهبان فانوس دریایی که از دهه ۱۹۲۰ به فراموشی سپرده شده را ترسیم کن، با یک دفترچه رهاشده، ابزارهای ناوبری قدیمی و یک فنجان چای در حال بخار کردن. نور از پنجره‌ای کهنه طوری عبور کرده که ذرات گرد و غبار در هوا را به نمایش می‌گذارد. صحنه‌ داستانی درباره تنهایی را با جزئیاتی مانند چوب‌های فرسوده، فلزات زنگ زده و کاغذهای کهنه و خورده‌شده روایت می‌کند »

Prompt: “A forgotten lighthouse keeper’s desk from the 1920s, with an abandoned journal, vintage navigation tools, and a steaming cup of tea. Light streams through a salt-crusted window, capturing dust particles in the air. The scene tells a story of solitude with detailed textures of weathered wood, tarnished brass, and dog-eared pages.

نتیجه لئوناردو

نتیجه آزمایش دوم هوش مصنوعی ساخت تصویر لئوناردو در تولید تصویر به سبک فوتورئالیستی

نتیجه آزمایش دوم هوش مصنوعی ساخت تصویر لئوناردو در تولید تصویر به سبک فوتورئالیستی

تصویر ارائه‌ شده توسط لئوناردو را می‌توان یک تولید قابل قبول نامید. این تصویر شباهتی نسبی با پرامپت داده شده به آن دارد، اگرچه با توجه به جزئیات، ادعای اینکه فضای تصویر متعلق به دهه ۱۹۲۰ است، کمی اغراق‌آمیز به نظر می‌رسد. تصویر به صورت کلی مشکلی ندارد، اما به نوعی بی‌روح و خنثی است. اگر ارزیابی سخت‌گیرانه و معلم‌وار در کار باشد، احتمالاً باید برچسب «می‌توانی بهتر تلاش کنی» را به لئوناردو داد. این بهترین نمونه از بین دست کم هشت تصویر تولید شده با این پرامپت در لئوناردو بود.

نتیجه فری پیک

نتیجه آزمایش دوم با هوش مصنوعی فری پیک در تولید تصویر به سبک فوتورئالیستی

نتیجه آزمایش دوم با هوش مصنوعی فری پیک در تولید تصویر به سبک فوتورئالیستی

تصویر تولیدی بسیار تأثیرگذار و خیره‌کننده است. نه تنها با پرامپت داده شده کاملاً منطبق است، بلکه سرشار از فضاسازی و شخصیت است. تقریباً می‌توان بوی محیط مرطوب یک فانوس دریایی را حس کرد، با ذرات غبار در هوا و ابزارهای قدیمی و برنجی که کاملاً با فضا هماهنگ‌اند. بافت چوب در تصویر چشم‌نواز و جزئیات آن در پردازش بی‌نظیر است. این تصویر نمونه خوبی از یک تصویر شاعرانه است که با فضای فانوس دریایی و مفهوم تنهایی به خوبی هماهنگ است.

برنده آزمایش دوم: فری پیک

آزمایش سوم در مقایسه لئوناردو و فری پیک: طراحی انتزاعی

پرامپت:

«صحنه‌ای با طراحی هندسی ترسیم کن که قوانین جاذبه را نقض می‌کند، با پله‌هایی از نظر منطقی ناممکن، الهام گرفته از آثار موریس اشر، همراه با یک پالت رنگی با رنگ‌های زنده. در این طراحی سازه‌هایی شبیه به پارچه‌های روان ایجاد کن که با فرم‌های بلوری (کریستالی) در هم‌تنیده‌اند، در حالی که انسان‌ها در آن در حالت ضدنور و در مقیاس کوچک نشان داده شده‌اند. ترکیب‌بندی تصویر با نظم و آشوب متوازن شده و از عناصر مورب بهره می‌برد.»

Prompt: “A geometric dreamscape where architecture defies gravity, featuring impossible staircases reminiscent of Escher’s work but with a vibrant color palette. Flowing fabric-like structures intersect with crystal formations, while small human silhouettes provide scale. The composition balances between order and chaos with strong diagonal elements.”

نتیجه لئوناردو

نتیجه آزمایش سوم لئوناردو در طراحی انتزاعی

نتیجه آزمایش سوم لئوناردو در طراحی انتزاعی

لئوناردو با پالت رنگی شاداب مدل فلاکس (Flux) همراه با عناصر طراحی‌وار جذابش، تصویری چشم‌نواز خلق کرده است. تصویر تولید شده توسط لئوناردو زنده است و در حالی که به پرامپت داده شده با تمرکز بر طراحی انتزاعی، وفادار است، حس سورئالیستی مورد نظر را هم به خوبی منتقل می‌کند. نکته‌ای که شاید تصویر را کمی ضعیف می‌کند، استفاده از انسان‌های واقعی به جای انسان‌های کوچک و ضد نوری است که در دستور متنی آمده بود و این قسمت کمی با پرامپت مغایرت دارد.

نتیجه فری پیک

نتیجه آزمایش سوم فری پیک در طراحی انتزاعی

نتیجه آزمایش سوم فری پیک در طراحی انتزاعی

در تصویر فری پیک تفسیری کاملاً متفاوت از همان پرامپت ارائه شده است. تصویر تفسیری ارگانیک‌تر و طبیعی‌تر دارد، که البته به معنای اشتباه بودن آن نیست، بلکه صرفاً متفاوت است. هر دو تصویر پویایی، رنگ‌های زنده و ارجاعاتی به آثار اشر را دارند. در تصویر فری پیک، حتی انسان‌های کوچک و ضد نور سیاه‌رنگ روی پله‌ها هم به خوبی نمایان هستند و این نشان از درک درست پرامپت توسط فری پیک دارد.

با اینکه فری پیک در نمایش انسان ها بیشتر مطابق پرامپت عمل کرد، اما فضای هندسی لیوناردو به صورت کلی به پرامپت داده شده نزدیکتر بود، بنابراین برنده این بخش لئوناردوست.

برنده آزمایش سوم: لئوناردو

آزمایش چهارم در مقایسه لئوناردو و فری پیک: طراحی صحنه‌ای از طبیعت

پرامپت:

«تصویری از یک عکس ماکرو تولید کن که لحظه شکل‌گیری قطره شبنم روی تار عنکبوت در سپیده دم را ثبت کند. درون قطره روی تار عنکبوت، انعکاس کاملی از جنگل اطراف دیده می‌شود، با جزئیاتی از درختان پوشیده از خزه و مه صبحگاهی. همچنین رنگ‌های پاستلی نرم ناشی از طلوع آفتاب، منشورهایی رنگی در قطره آب ایجاد کرده‌اند.»

Prompt: “A macro photograph capturing the moment a dewdrop forms on a spider’s web at dawn. Within the dewdrop, a perfect reflection of the surrounding forest appears, with details of moss-covered trees and morning mist. Soft pastel colors from the sunrise create rainbow prisms through the water droplet.”

نتیجه لئوناردو

نتیجه آزمایش چهارم هوش مصنوعی لئوناردو در طراحی صحنه‌ای از طبیعت

نتیجه آزمایش چهارم هوش مصنوعی لئوناردو در طراحی صحنه‌ای از طبیعت

هر دو مدل هوش مصنوعی در تولید تصویر با این پرامپت چالش داشتند، اما لئوناردو به صورت کلی عملکرد بهتری داشت. در تصویر لئوناردو تار عنکبوت واقعی به نظر می‌رسد، فضای جنگل حالت صبحگاهی آن را به خوبی در ذهن تداعی می‌کند و حس عکس ماکرو را به خوبی منتقل می‌کند.

نتیجه فری پیک

نتیجه آزمایش چهارم هوش مصنوعی فری پیک در طراحی صحنه‌ای از طبیعت

نتیجه آزمایش چهارم هوش مصنوعی فری پیک در طراحی صحنه‌ای از طبیعت

تصویر فری پیک علی رغم زیبایی و وفاداری اش به پرامپت، کمی ناامید کننده بود. تار عنکبوت کم‌رنگ و در تصویر بی‌اهمیت است و قطره شبنم بیش از حد بزرگ و غیرطبیعی به نظر می‌رسد. اما انعکاس محیط جنگل درون قطره عالی است، با این حال فری پیک در تفسیر کلی پرامپت ضعیف عمل کرده است.

برنده آزمایش چهارم: لئوناردو

آزمایش پنجم: طراحی یک محیط فانتزی

پرامپت:

«کتابخانه‌ای جادویی در زیر دریا طراحی کن که موجودات دریایی شب تاب کتاب‌های قدیمی زیر آب، قفسه‌هایی از مرجان‌های رنگارنگ و نسخه‌هایی از متون معلق در فضا را روشن می‌کنند. همچنین نور آبی و سبز اسرارآمیز از سطح دریا به صحنه می‌تابد. داخل صحنه پله‌های مارپیچی از صدف و مروارید به عمق کتابخانه می‌روند.»

Prompt:”A magical underwater library where bioluminescent sea creatures illuminate ancient books, detailed with vibrant coral shelves and floating text manuscripts. The scene is bathed in ethereal blue and green light filtering through the ocean surface above. The library extends into the depths with spiral staircases made of shells and pearls.”

نتیجه لئوناردو

نتیجه آزمایش پنجم لئوناردو در طراحی یک محیط فانتزی

نتیجه آزمایش پنجم لئوناردو در طراحی یک محیط فانتزی

این تصویر هم بهترین خروجی از میان حداقل هشت تولید شده توسط لئوناردو است. تصویر به صورت کلی قابل قبول است، اما حس و حال واقعی ندارد و تکرار المان‌ها در آن زیاد است. مدل فلاکس (Flux) تصویر را کمی بی روح کرده است. دلیل انتخاب این تصویر از میان هشت تصویر دیگر، تلاش بهتر آن برای نشان دادن جنبه شب تاب در صحنه بود، اما در کل تصویر فاقد هیجان و شگفتی است.

نتیجه فری پیک

نتیجه آزمایش پنجم فری پیک در طراحی یک محیط فانتزی

نتیجه آزمایش پنجم فری پیک در طراحی یک محیط فانتزی

بار دیگر مدل میستیک (Mystic 2.5) برتری خود را نشان داد. تصویر تولید شده با فری پیک بسیار چشمگیر است. زنده، رنگارنگ، وفادار به پرامپت و واقعاً جذاب. چشم بیننده به سمت منحنی‌های مرموز تصویر کشیده می‌شود. اگرچه پله‌ها از صدف و مروارید نیستند، اما استفاده خلاقانه از مرجان‌ها و نورپردازی آن‌قدر خوب است که می‌توان از این کاستی چشم‌پوشی کرد.

برنده آزمایش پنجم: فری پیک

برنده نهایی: فری پیک

پیش از آغاز این آزمایش، تصور می‌شد برند قدرتمند و باسابقه‌ لئوناردو به طور قطعی پیروز میدان باشد. اما این تصور با اولین تصویر تولیدشده توسط مدل میستیک ۲.۵ فلکسیبل (Mystic 2.5 Flexible) با فری پیک کاملاً زیر سؤال رفت.

در پنج مرحله از مقایسه لئوناردو و فری پیک، فری پیک با قدرت در سه مرحله به پیروزی رسید و در آزمایش سوم تحت عنوان «طراحی انتزاعی» با اختلاف بسیار کمی به لئوناردو باخت (حتی از نظر برخی تصویر تولید شده توسط فری پیک این مرحله را هم می‌برد). در هر حال برنده نهایی فری پیک است.

مشخص نیست دقیقاً چه رویکردی در فری پیک اتخاذ شده که چنین ابزار قدرتمند و سطح بالایی در تولید تصویر هوش مصنوعی را ارائه کرده، اما آن‌چه مسلم است این است که رقابت در دنیای تولید تصویر با هوش مصنوعی به مراتب پیچیده‌تر از تصورات ما در گذشته شده است. آنچه فری پیک را تحسین‌برانگیز می‌کند، صرفاً تولید تصویر نیست. با بررسی دیگر امکانات آن، نظیر تولید ماک‌آپ با رابط کاربری ساده و خروجی‌های شگفت‌انگیز و باکیفیت، مشخص شد که این پلتفرم ارزش زیادی برای کاربران حرفه‌ای خود قا‌ئل است.

منبع: tom’s guide

source

توسط chehrenet.ir