خبرهایی از چین به گوش میرسد که نشان میدهد شرکت دیپ سیک در تدارک رونمایی از یک مدل هوش مصنوعی جدید با نام R2 است. گمانهزنیها حاکی از ان است که این مدل میتواند موج تازهای در بازار جهانی هوش مصنوعی ایجاد کند، به خصوص که اطلاعات درز کرده از قیمتگذاری بسیار پایین آن خبر میدهند. بر اساس این اطلاعات، هزینهی استفاده از دیپسیک R2 ممکن است تا 97 درصد کمتر از مدل قدرتمند GPT-4 باشد، موضوعی که پتانسیل تغییر معادلات فعلی را دارد.
پیش از این، مدل R1 شرکت DeepSeek توانایی چین را در رقابت با غولهای غربی هوش مصنوعی به خوبی نشان داده بود. معرفی R1 تاثیر قابل توجهی بر بازارهای مالی گذاشت و باعث کاهش ارزش سهام شرکتهای بزرگ فناوری در آمریکا شد. این اتفاق ثابت کرد که برای توسعهی مدلهای زبانی بزرگ و پیشرفته، لزوما نیازی به سرمایهگذاریهای کلان و سرسامآور، آنطور که شرکتهایی مانند OpenAI ادعا میکنند، وجود ندارد. حالا، شایعات پیرامون مدل R2، انتظارها را برای مشاهدهی پیشرفتهای بزرگتر و قابلتوجهتر افزایش داده است.
یکی از ویژگیهای کلیدی که دربارهی دیپسیک R2 مطرح میشود، بهرهگیری آن از معماری پیشرفتهی MoE یا همان «ترکیب متخصصان» (Mixture of Experts) است. این معماری احتمالا با استفاده از مکانیزمهای دروازهبندی (Gating Mechanisms) نوین یا ترکیبی هوشمندانه از لایههای MoE و لایههای متراکم (Dense Layers) طراحی شده تا بتواند پردازشهای محاسباتی سنگین را با کارایی بالاتری مدیریت کند. همچنین گفته میشود تعداد پارامترهای این مدل به حدود 1.2 تریلیون میرسد که تقریبا دو برابر مدل قبلی، یعنی R1، است. این عدد بزرگ، R2 را در کنار مدلهای بسیار پیشرفتهای مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل قرار میدهد و نشان از قدرت بالقوهی آن دارد.
اما جذابترین بخش شایعات، مربوط به هزینهی استفاده از این مدل قدرتمند است. طبق گزارشهای غیررسمی، هزینه پردازش هر یک میلیون توکن ورودی در DeepSeek R2 تنها 0.07 دلار و هزینه پردازش هر یک میلیون توکن خروجی حدود 0.27 دلار خواهد بود. این ارقام نشاندهندهی کاهشی تقریبا 97 درصدی در مقایسه با هزینههای مدل GPT-4 شرکت OpenAI است. اگر این قیمتگذاری تایید شود، DeepSeek R2 میتواند به سرعت به یکی از اقتصادیترین و جذابترین گزینهها برای کسبوکارها، سازمانها و توسعهدهندگانی تبدیل شود که به دنبال استفاده از هوش مصنوعی پیشرفته با بودجهی محدودتر هستند. این کاهش چشمگیر هزینه میتواند دسترسی به فناوریهای سطح بالا را دموکراتیکتر کند و تحولی جدی در جنبههای اقتصادی هوش مصنوعی پدید آورد.
نکتهی دیگری که در مورد R2 فاش شده، به زیرساخت آموزشی آن مربوط میشود. ظاهرا فرایند آموزش این مدل با استفاده از تراشههای Ascend 910B ساخت شرکت هواوی انجام گرفته است. DeepSeek توانسته به بهرهوری 82 درصدی از این خوشهی پردازشی دست پیدا کند که نشاندهندهی بهینهسازیهای موفق این شرکت در استفاده از سختافزار داخلی است. قدرت پردازشی این خوشه در دقت FP16 به 512 پتافلاپس میرسد. این موفقیت در بهرهبرداری حداکثری از منابع داخلی و تراشههای چینی، نشان از تلاش DeepSeek برای یکپارچهسازی عمودی زنجیرهی تامین خود و کاهش وابستگی به تامینکنندگان خارجی دارد.
البته باید تاکید کرد که تمام این اطلاعات فعلا در حد شایعه و گزارشهای تایید نشده باقی میمانند. شرکت دیپسیک هنوز به طور رسمی این جزئیات را اعلام نکرده است. با این حال، اگر این گمانهزنیها صحت داشته باشند و DeepSeek R2 با چنین مشخصات و هزینهای عرضه شود، بدون شک شاهد یک غافلگیری بزرگ دیگر در عرصهی هوش مصنوعی خواهیم بود. چنین مدلی میتواند موازنهی قدرت را در بازار تغییر دهد و چالش جدیتری را پیش روی رقبای غربی، به خصوص شرکتهای آمریکایی، قرار دهد. باید منتظر ماند و دید که آیا DeepSeek بار دیگر جهان فناوری را شگفتزده خواهد کرد یا خیر.
منبع: wccftech
source