28 - 04 - 2025
هوش مصنوعی بعدی «دیپسیک» ۹۷ درصد کمهزینهتر از «GPT-4»
«جهانصنعت»- مدل جدید «DeepSeek R2» با معماری پیشرفته و ۹۷درصد هزینه کمتر نسبت به مدل پیشرفته«GPT-4» معرفی میشود. به گفته یک افشاگر چینی، استارتاپ دیپسیک بهزودی مدل جدید خود با نام «DeepSeek R2» را معرفی خواهد کرد. پس از موفقیت مدل R1 که نشان داد چین در توسعه مدلهای هوش مصنوعی پیشرفته عقب نمانده است، R2 میتواند بار دیگر بازار جهانی را تحت تاثیر قرار دهد. گفته میشود «DeepSeek R2» از معماری ترکیبی Mixture of Experts (MoE) بهره میبرد که نسخه پیشرفتهتری از معماریهای موجود محسوب میشود و احتمالا شامل مکانیسمهای گیتینگ پیشرفته یا ترکیبی از لایههای MoE و Dense برای بهینهسازی عملکرد در پردازشهای سنگین خواهد بود. این مدل قرار است با 2/1تریلیون پارامتر عرضه شود؛ عددی که R2 را در سطح مدلهایی همچون GPT-4 Turbo و Gemini 2.0 Pro قرار میدهد. ظاهرا هزینه پردازش در R2 نسبت به «GPT-4» بهطور قابل توجهی کاهش یافته است و برای هر یک میلیون توکن ورودی 07/0دلار و خروجی 27/0دلار خواهد بود. این کاهش هزینه میتواند «DeepSeek R2» را به گزینهای بسیار مقرونبهصرفه برای سازمانها تبدیل کند. از دیگر جزئیات فنی فاششده، استفاده «DeepSeek R2» از خوشه پردازشی مبتنیبر تراشه «Ascend 910B» هوآوی با توان پردازشی ۵۱۲ پتافلاپس (با دقت FP16) است؛ موضوعی که نشان میدهد DeepSeek با تکیه بر منابع داخلی، زنجیره تامین هوش مصنوعی خود را بهطور کامل یکپارچه کرده است. باید توجه داشت که اطلاعات موجود رسمی نیستند و ممکن است مشخصات نهایی مدل متفاوت باشد.
لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد