خبرهایی از چین به گوش می‌رسد که نشان می‌دهد شرکت دیپ سیک در تدارک رونمایی از یک مدل هوش مصنوعی جدید با نام R2 است. گمانه‌زنی‌ها حاکی از ان است که این مدل می‌تواند موج تازه‌ای در بازار جهانی هوش مصنوعی ایجاد کند، به خصوص که اطلاعات درز کرده از قیمت‌گذاری بسیار پایین آن خبر می‌دهند. بر اساس این اطلاعات، هزینه‌ی استفاده از دیپ‌سیک R2 ممکن است تا 97 درصد کمتر از مدل قدرتمند GPT-4 باشد، موضوعی که پتانسیل تغییر معادلات فعلی را دارد.

پیش از این، مدل R1 شرکت DeepSeek توانایی چین را در رقابت با غول‌های غربی هوش مصنوعی به خوبی نشان داده بود. معرفی R1 تاثیر قابل توجهی بر بازارهای مالی گذاشت و باعث کاهش ارزش سهام شرکت‌های بزرگ فناوری در آمریکا شد. این اتفاق ثابت کرد که برای توسعه‌ی مدل‌های زبانی بزرگ و پیشرفته، لزوما نیازی به سرمایه‌گذاری‌های کلان و سرسام‌آور، آنطور که شرکت‌هایی مانند OpenAI ادعا می‌کنند، وجود ندارد. حالا، شایعات پیرامون مدل R2، انتظارها را برای مشاهده‌ی پیشرفت‌های بزرگ‌تر و قابل‌توجه‌تر افزایش داده است.

دیپ‌سیک

یکی از ویژگی‌های کلیدی که درباره‌ی  دیپ‌سیک R2 مطرح می‌شود، بهره‌گیری آن از معماری پیشرفته‌ی MoE یا همان «ترکیب متخصصان» (Mixture of Experts) است. این معماری احتمالا با استفاده از مکانیزم‌های دروازه‌بندی (Gating Mechanisms) نوین یا ترکیبی هوشمندانه از لایه‌های MoE و لایه‌های متراکم (Dense Layers) طراحی شده تا بتواند پردازش‌های محاسباتی سنگین را با کارایی بالاتری مدیریت کند. همچنین گفته می‌شود تعداد پارامترهای این مدل به حدود 1.2 تریلیون می‌رسد که تقریبا دو برابر مدل قبلی، یعنی R1، است. این عدد بزرگ، R2 را در کنار مدل‌های بسیار پیشرفته‌ای مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل قرار می‌دهد و نشان از قدرت بالقوه‌ی آن دارد.

اما جذاب‌ترین بخش شایعات، مربوط به هزینه‌ی استفاده از این مدل قدرتمند است. طبق گزارش‌های غیررسمی، هزینه پردازش هر یک میلیون توکن ورودی در DeepSeek R2 تنها 0.07 دلار و هزینه پردازش هر یک میلیون توکن خروجی حدود 0.27 دلار خواهد بود. این ارقام نشان‌دهنده‌ی کاهشی تقریبا 97 درصدی در مقایسه با هزینه‌های مدل GPT-4 شرکت OpenAI است. اگر این قیمت‌گذاری تایید شود، DeepSeek R2 می‌تواند به سرعت به یکی از اقتصادی‌ترین و جذاب‌ترین گزینه‌ها برای کسب‌وکارها، سازمان‌ها و توسعه‌دهندگانی تبدیل شود که به دنبال استفاده از هوش مصنوعی پیشرفته با بودجه‌ی محدودتر هستند. این کاهش چشمگیر هزینه می‌تواند دسترسی به فناوری‌های سطح بالا را دموکراتیک‌تر کند و تحولی جدی در جنبه‌های اقتصادی هوش مصنوعی پدید آورد.

دیپ‌سیک

نکته‌ی دیگری که در مورد R2 فاش شده، به زیرساخت آموزشی آن مربوط می‌شود. ظاهرا فرایند آموزش این مدل با استفاده از تراشه‌های Ascend 910B ساخت شرکت هواوی انجام گرفته است. DeepSeek توانسته به بهره‌وری 82 درصدی از این خوشه‌ی پردازشی دست پیدا کند که نشان‌دهنده‌ی بهینه‌سازی‌های موفق این شرکت در استفاده از سخت‌افزار داخلی است. قدرت پردازشی این خوشه در دقت FP16 به 512 پتافلاپس می‌رسد. این موفقیت در بهره‌برداری حداکثری از منابع داخلی و تراشه‌های چینی، نشان از تلاش DeepSeek برای یکپارچه‌سازی عمودی زنجیره‌ی تامین خود و کاهش وابستگی به تامین‌کنندگان خارجی دارد.

البته باید تاکید کرد که تمام این اطلاعات فعلا در حد شایعه و گزارش‌های تایید نشده باقی می‌مانند. شرکت دیپ‌سیک هنوز به طور رسمی این جزئیات را اعلام نکرده است. با این حال، اگر این گمانه‌زنی‌ها صحت داشته باشند و DeepSeek R2 با چنین مشخصات و هزینه‌ای عرضه شود، بدون شک شاهد یک غافلگیری بزرگ دیگر در عرصه‌ی هوش مصنوعی خواهیم بود. چنین مدلی می‌تواند موازنه‌ی قدرت را در بازار تغییر دهد و چالش جدی‌تری را پیش روی رقبای غربی، به خصوص شرکت‌های آمریکایی، قرار دهد. باید منتظر ماند و دید که آیا DeepSeek بار دیگر جهان فناوری را شگفت‌زده خواهد کرد یا خیر.

79,890,000

74,899,000

تومان

منبع: wccftech

source

توسط chehrenet.ir