الصين تطلق نموذج DeepSeek V3 الذكي.. تفوق تقني وتحديات جديدة
أعلنت شركة DeepSeek الصينية عن إطلاق نموذجها الذكي الجديد DeepSeek V3.
أثبت النموذج قدرة كبيرة على التفوق في مجالات متنوعة مثل كتابة الأكواد البرمجية وإنشاء النصوص، متفوقاً بذلك على نماذج رائدة أخرى في هذا المجال مثل Llama 3.1 405B من ميتا، وGPT-4 من OpenAI، بالإضافة إلى Qwen 2.5 72B من علي بابا، وفقاً لاختبارات منصة Cpdefprces للبرمجة الآلية.
مميزات نموذج DeepSeek V3
ويتميز DeepSeek V3 بقدرته على أداء مهام متعددة مثل الترجمة الفورية وكتابة الأكواد البرمجية الجديدة التي تتماشى مع الأكواد الحالية.
- شاشة مضادة للانعكاس.. تسريبات جديدة تكشف عن مواصفات Galaxy S25 Ultra
- العمل عن بعد.. أداة الازدهار لـBluesky في 2024
كما سجل النموذج الصيني نتائج استثنائية في اختبار Aider Polyglot، الذي يقيس قدرة النماذج الذكية على كتابة الأكواد البرمجية، ما يعزز مكانته في صدارة الابتكارات التقنية.
التدريب والقدرات التقنية
نموذج DeepSeek V3 تم تدريبه على قاعدة بيانات ضخمة تحتوي على 12.8 تريليون توكن "وحدة تمثيل البيانات النصية"، وهو ما يعادل ما يقرب من 9.6 مليون كلمة لكل مليون توكن.
ويعتمد النموذج على 685 مليار متغير، مما يجعله أكثر تطوراً مقارنة بنموذج ميتا Llama 3.1 الذي يحتوي على 405 مليارات متغير.
ويتفوق DeepSeek V3 بنسبة 1.6 مرة من حيث عدد المتغيرات، وهو ما يعكس تقدماً تقنياً كبيراً في قدرة النموذج على معالجة وتحليل البيانات.
التدريب باستخدام رقائق إنفيديا H800
وعلى الرغم من أن DeepSeek V3 تم تدريبه باستخدام رقائق إنفيديا H800، التي حظرتها وزارة التجارة الأمريكية مؤخراً من التصدير إلى الصين، إلا أن الشركة الصينية تمكنت من تدريب النموذج في غضون شهرين فقط، باستخدام ميزانية قدرها 5.5 مليون دولار، وهو ما يعتبر مبلغاً زهيداً مقارنة بالتكاليف الضخمة لتدريب النماذج الذكية.
التحديات والانتقادات
رغم تقدمه التقني، واجه DeepSeek V3 بعض القضايا المثيرة للجدل، أبرزها وجود محاذير معينة في ردوده على بعض الأسئلة الحساسة.
وعلى سبيل المثال، رفض النموذج الإجابة على أسئلة تتعلق بمسائل شائكة مثل مظاهرات ميدان تيانانمين التي وقعت في 1989.
وتبرر الشركة هذه التصرفات بتوجهات حكومية صارمة على النماذج الذكية في الصين، حيث يجب أن تخضع جميع النماذج للاختبار والموافقة من قبل مؤسسة حكومية متخصصة.
ارتباك في التعريف الذاتي
كما لوحظت مشكلة أخرى في تعريف النموذج لنفسه، فقد ذكر بعض المستخدمين، عبر منصة إكس، أن DeepSeek V3 كان يجيب أحياناً على أسئلة باعتباره ChatGPT، بل وعرض طريقة استخدام واجهته البرمجية الخاصة بالمطورين كما لو كانت واجهة ChatGPT.
ويُعتقد أن هذا يعود إلى أن النموذج قد تدرب على محتوى من الإنترنت الذي يتضمن تعريفات من نماذج ذكاء اصطناعي أخرى مثل ChatGPT.
وهذا النوع من المشاكل ليس فريداً، إذ كان نموذج Gemini من غوغل قد وقع في نفس الخطأ عند تعريف نفسه كنموذج Wenxinyiyan الخاص بشركة بايدو.
ويُعزى ذلك إلى أن النماذج الذكية تتدرب على محتوى مفتوح المصدر عبر الإنترنت، والذي قد يحتوي أحياناً على تعريفات نموذجية من منصات منافسة.
ومن المتوقع أن يتزايد محتوى الإنترنت المولد بواسطة الذكاء الاصطناعي ليصل إلى 90% بحلول عام 2026، مما يطرح تساؤلات جديدة حول التنافس بين النماذج الذكية.
aXA6IDE4LjIyNC41NC4xMTgg جزيرة ام اند امز