أبل تكشف عن علامة مثيرة للقلق لمستقبل الذكاء الاصطناعي
اكتشف فريق أبحاث الذكاء الاصطناعي في شركة أبل نقاط ضعف كبيرة في القدرات المنطقية لنماذج اللغات الكبيرة، وذلك وفقًا لدراسة نُشرت حديثا.
توضح الدراسة، المنشورة على موقع "arXiv"، تقييم أبل لمجموعة من النماذج اللغوية الرائدة، بما في ذلك نماذج OpenAI وميتا وغيرهم من المطورين البارزين، لتحديد مدى قدرة هذه النماذج على التعامل مع مهام الاستدلال الرياضي.
تكشف النتائج أنه حتى التغييرات الطفيفة في صياغة الأسئلة يمكن أن تسبب تناقضات كبيرة في أداء النموذج مما قد يؤدي إلى تقويض موثوقيتها في السيناريوهات التي تتطلب الاتساق المنطقي.
تلفت شركة أبل الانتباه إلى مشكلة مستمرة في نماذج اللغة، وهي اعتمادها على مطابقة الأنماط بدلا من التفكير المنطقي الحقيقي.
في العديد من الاختبارات، أثبت الباحثون أن إضافة معلومات غير ذات صلة إلى سؤال ما - تفاصيل لا ينبغي أن تؤثر على النتيجة الرياضية - يمكن أن يؤدي إلى إجابات مختلفة إلى حد كبير عن النماذج.
يتضمن أحد الأمثلة الواردة في الورقة مسألة رياضية بسيطة تسأل عن عدد حبات الكيوي التي جمعها الشخص على مدار عدة أيام.
عندما تم تقديم تفاصيل غير ذات صلة حول حجم بعض حبات الكيوي، قامت نماذج مثل OpenAI's o1 وMeta's Llama بتعديل الإجمالي النهائي بشكل غير صحيح، على الرغم من أن المعلومات الإضافية ليس لها أي تأثير على الحل.
دفعت هذه الهشاشة في التفكير الباحثين إلى استنتاج أن النماذج لا تستخدم المنطق الحقيقي لحل المشكلات ولكنها تعتمد بدلا من ذلك على التعرف على الأنماط المتطورة التي تم تعلمها أثناء التدريب.
وفقا لموقع "macrumors"، وجدوا أن "مجرد تغيير الأسماء يمكن أن يغير النتائج"، وهي علامة قد تكون مثيرة للقلق بالنسبة لمستقبل تطبيقات الذكاء الاصطناعي التي تتطلب تفكيرا متسقا ودقيقا في سياقات العالم الحقيقي.
وفقًا للدراسة، أظهرت جميع النماذج التي تم اختبارها، بدءا من الإصدارات الأصغر مفتوحة المصدر مثل Llama إلى النماذج الخاصة مثل OpenAI’s GPT-4o، تدهورا كبيرا في الأداء عندما واجهت اختلافات تبدو غير مهمة في بيانات الإدخال.
تقترح شركة أبل أن الذكاء الاصطناعي قد يحتاج إلى الجمع بين الشبكات العصبية والتفكير التقليدي القائم على الرموز والذي يسمى الذكاء الاصطناعي الرمزي العصبي للحصول على قدرات أكثر دقة في اتخاذ القرار وحل المشكلات.
aXA6IDE4LjExNi4yNC4xMTEg
جزيرة ام اند امز