الصين تضرب مجددا.. «علي بابا» تطلق نموذج ذكاء اصطناعي «أقوى» من «ديب سيك»
يتفوق على GPT-4o وLlama-3.1-405B
أعلنت شركة التكنولوجيا الصينية "علي بابا"، اليوم الأربعاء، عن إطلاق إصدار جديد من نموذجها الخاص للذكاء الاصطناعي Qwen 2.5، مدعية أنه أقوى من ذلك الذي أصدرته "ديب سيك" والذي تسبب في هزة بقطاع التكنولوجيا الأمريكي.
الإصدار الجديد الفائق من Qwen 2.5، تزعم "علي بابا" أنه يتفوق على نموذج DeepSeek-V3 الذي نال استحسانًا كبيرًا وأحدث ضجة كبيرة في عالم التقنيات خلال الأيام القليلة الماضية.
ووفق ما أفادت وكالة رويترز، يشير التوقيت غير المعتاد لإطلاق Qwen 2.5-Max، في اليوم الأول من السنة القمرية الجديدة، وقت احتفالات العام الصيني الجديد، وفي وقت يكون معظم الصينيين به في إجازة من العمل ومع عائلاتهم، إلى الضغط الذي فرضه صعود شركة الذكاء الاصطناعي الصينية الناشئة DeepSeek في الأسابيع الثلاثة الماضية ليس فقط على المنافسين في الخارج، ولكن أيضًا على منافسيها المحليين وأبرزهم علي بابا.
أقوى من ديب سيك وتشات جي بي تي
وأكدت وحدة الحوسبة السحابية الصينية التابعة لشركة علي بابا، تفوق نموذج Qwen 2.5-Max تقريبًا على نماذج GPT-4o و DeepSeek-V3 و Llama-3.1-405B في جميع المجالات، في إعلان نُشر على حسابها الرسمي على WeChat.
وسبب إصدار DeepSeek لمساعد الذكاء الاصطناعي الذي يعمل بنموذج DeepSeek-V3 يوم 10 يناير/كانون الثاني بالإضافة إلى إصدار 20 يناير/كانون الثاني لنموذج R1، صدمة كبيرة لوادي السيليكون وتسبب في انخفاض أسهم التكنولوجيا، حيث دفعت تكاليف التطوير والاستخدام المنخفضة للشركة الناشئة الصينية المستثمرين إلى التشكيك في خطط الإنفاق الضخمة من قبل شركات الذكاء الاصطناعي الرائدة في الولايات المتحدة.
لكن نجاح DeepSeek أدى أيضًا لتحفيز الصراع بين منافسيها المحليين لترقية نماذج الذكاء الاصطناعي الخاصة بهم.
على سبيل المثال، بعد يومين من إصدار DeepSeek-R1، أصدرت شركة ByteDance، المالكة لـ TikTok، تحديثًا لنموذج الذكاء الاصطناعي الرائد الخاص بها، والذي ادعت أنه تفوق على نموذج o1 من OpenAI المدعومة من Microsoft في AIME، وهو اختبار معياري يقيس مدى فهم نماذج الذكاء الاصطناعي واستجابتها للتعليمات المعقدة.
وهذا يعكس ادعاء DeepSeek بأن نموذج R1 الخاص بها ينافس o1 من OpenAI في العديد من معايير الأداء.
وفيما يخص الإصدار الجديد من نموذج علي بابا للذكاء الاصطناعي، قالت وحدة الحوسبة السحابية التابعة للشركة Qwen عبر منشور لها على منصة إكس، إن موجة DeepSeek V3 جذبت انتباه مجتمع الذكاء الاصطناعي بأكمله إلى النماذج واسعة النطاق، وفي الوقت نفسه، كنا نعمل على بناء Qwen2.5-Max، وهو نموذج روبوت دردشة لغوي ذكي كبير تم تدريبه مسبقًا على بيانات ضخمة وتم تدريبه لاحقًا باستخدام وصفات SFT وRLHF المنسقة.
وتابعت بقولها "إنه يحقق أداءً تنافسيًا ضد النماذج من الدرجة الأولى، ويتفوق على DeepSeek V3 في معايير مثل Arena Hard وLiveBench وLiveCodeBench وGPQA-Diamond.
واختتمت الصفحة الرسمية لـ Qwen التغريدة بقولها: "في المستقبل، لن نستمر في التوسع في مرحلة ما قبل التدريب فحسب، بل سنستثمر أيضًا في التوسع في التعلم المعزز، ونأمل أن تتمكن Qwen من استكشاف المجهول في المستقبل القريب".
aXA6IDE4LjIyMi4xMjAuMTI0IA== جزيرة ام اند امز