“ديب سيك” تخطط لإطلاق نموذج R2 في هذا الموعد

تواصل الشركات العملاقة توظيف الذكاء الاصطناعي في تطبيقات وابتكارات هامة وتستعد شركة ديب سيك لإطلاق نموذج اللغة الكبير من الجيل التالي، DeepSeek-R2، في وقت ما بين 15 أغسطس و30 أغسطس 202
نافذة نموذج DeepSeek-R1
وقد ظهرت نافذة الإطلاق أثناء التفاعل مع نموذج الذكاء الاصطناعي الخاص بشركة ديب سيك، مما يشير إلى طرح وشيك بعد أيام فقط من إصدار ChatGPT-5.
من المتوقع أن يُحدث نموذج R2 من “ديب سيك” نقلة نوعية في بنيته التحتية باعتماده نظامًا أكثر تطورًا لمزيج الخبراء (MoE)، بحسب تقرير نشره موقع “gizmochina”
كما سيدمج شبكة بوابات أكثر ذكاءً للتعامل بشكل أفضل مع أعباء العمل كثيفة الاستدلال.
مزايا نموذج DeepSeek-R1
ووفقًا لمصادر مطلعة على تطويره، يُمكن للنموذج توسيع نطاقه ليشمل 1.2 تريليون مُعامل، أي ما يقرب من ضعف مُعامل DeepSeek-R1، الذي كان يضم 671 مليار مُعامل.
وسيظل هذا أقل من شات جي بي تي 4 و5، الذي يضم أكثر من 1.8 تريليون مُعامل.
في خطوة استراتيجية نحو تحقيق الاكتفاء الذاتي في مجال الذكاء الاصطناعي محليًا، تم تدريب النموذج بالكامل على شرائح Ascend 910B من “هواوي”.
وتُشير التقارير إلى أن مجموعة الحوسبة من “هواوي”، التي تُقدم أداءً قدره 512 بيتافلوبس من FP16 بنسبة استخدام 82%، تُحقق 91% من أداء مجموعة A100 من “إنفيديا”.
ويرى المحللون أن هذه خطوة حاسمة في تقليل اعتماد الصين على أجهزة الذكاء الاصطناعي الأميركية الصنع.
وتُشير التقارير إلى أن تكلفة تدريب DeepSeek-R2 أقل بنسبة 97% من تكلفة تدريب GPT-4، بفضل الأجهزة المحلية وتقنيات التحسين.
ويتوقع المحللون أن تُوفر “ديب سيك” إمكانية الوصول إلى واجهة برمجة التطبيقات (API) بأسعار أقل، مما قد يُحدث تغييرًا جذريًا في نماذج التسعير الحالية التي تُهيمن عليها “OpenAI” و”أنثروبيك”.
ما هو نموذج DeepSeek-R1 ؟
نموذج DeepSeek-R1 هو نموذج لغوي واسع النطاق (LLM) مفتوح المصدر طورته شركة DeepSeek، وهو مصمم لمهام الاستدلال وحل المشكلات التي تتطلب التفكير المنطقي والرياضي واتخاذ القرارات في الوقت الفعلي