نموذج أبل للذكاء الاصطناعي.. كيف يعمل «فيريت»؟
أطلقت شركة أبل نموذج التعلم الآلي متعدد الوسائط المفتوح المصدر فيريت “Ferret”، والذي يمثل إضافة مهمة في مجال الذكاء الاصطناعي التفاعلي، إليكم أهم التفاصيل.
نموذج فيريت الذي تم العمل على تطويره منذ أكتوبر/تشرين الأول الماضي، بالتعاون مع باحثين من جامعة كورنيل، شغل اهتمام مجتمع الذكاء الاصطناعي.
يحلل فيريت مناطق محددة في الصور، حيث يتعرف على العناصر الرئيسية، مما يتيح للمستخدمين استخدام العناصر كاستفسارات، ما يستدعي ردود فيريت.
قدرات الأداة
يستطيع النموذج استغلال المعلومات السياقية من عناصر أخرى في الصورة تجعله يبرز قدراته الفريدة، حيث يستطيع الدمج بين فهم الصور وفهم اللغة لتمكين الأنظمة الذكية من الإشارة إلى الصور وتحديد مواقعها.
كما يجمع بين التمثيل المبني على الإحداثيات والميزات، مما يمكنه من فهم العلاقات المكانية بين أجزاء مختلفة من الصورة، ويوفر إجابات لأسئلة حول أشياء أو كائنات أو مشاهد محددة داخل الصورة.
وأصدر فيريت تحت ترخيص غير تجاري، لكن يمكن استخدامه في منتجات أو خدمات أبل المستقبلية، إذ يمكنه معالجة الاضطرابات التي تواجهها النماذج التوليدية، فهو يخفف من المشكلة من خلال دمج التقنيات التي تعمل على تحسين قدرة النموذج على توليد معلومات مرئية دقيقة وذات صلة بالسياق.
وتم تدريب فيريت من خلال مجموعة بيانات "GRID"، التي تحتوي على حوالي 1.1 مليون حوار متعدد الوسائط، وتشمل المجموعة تحويل بيانات متطورة إلى تنسيقات تتبع التعليمات، وتوليد البيانات عبر استفسارات ChatGPT وGPT-4.
يمثل فيريت نقلة في الذكاء الاصطناعي، حيث يعكس استجابة الشركة لتحديات الصناعة، إذ تواجه أبل بعض القيود في مواردها الحاسوبية مقارنةً بمايكروسوفت وغوغل، وكان يجب عليها الاختيار بين تكوين شراكات أو الاعتماد على نهج مفتوح المصدر.
إطلاق فيريت يتحدى كل تصورات الصناعة في أبل، ويظهر الصراع الشديد في مجال الذكاء الاصطناعي، وإطلاق النموذج في الخفاء يدعو للتأمل ويثير التساؤلات حول الدور المتطور لشركة أبل في تطوير الذكاء الاصطناعي.