«Whisper».. أداة جديدة من OpenAI مدربة على استخدام يوتيوب
أثناء تطويرها لأحدث التقنيات، استنفدت شركة الذكاء الاصطناعي OpenAI مخزونها من النصوص باللغة الإنجليزية على الإنترنت.
ولحل هذه المشكلة، قام الباحثون في OpenAI بتطوير أداة تسمى Whisper والتي تستخدم لتحويل الصوت من مقاطع الفيديو على يوتيوب إلى نصوص جديدة.
- أفضل سماعات الواقع الافتراضي لعام 2024.. الواقع وراء الخيال
- الكشف عن هوية الأرقام المجهولة.. ميزة تتيحها «غوغل» على تطبيق الهاتف
وتهدف هذه الأداة إلى تحسين قدرة الذكاء الاصطناعي على الفهم والتعامل مع النصوص.
وأشار 3 أشخاص مطلعين على المحادثات إلى أن بعض موظفي OpenAI ناقشوا التداعيات المحتملة لهذه الخطوة على قواعد يوتيوب.
وفقًا لتقرير نشرته صحيفة "نيويورك تايمز"، يحظر يوتيوب، الذي يملكه غوغل، استخدام مقاطع الفيديو الخاصة به في تطبيقات مستقلة عن منصته.
ووفقًا للمصادر، قام فريق OpenAI بنسخ أكثر من مليون ساعة من مقاطع الفيديو على يوتيوب لاستخدامها في تطوير الأدوات الجديدة.
وذكرت المصادر أيضًا أن رئيس OpenAI غريغ بروكمان كان من بين الأشخاص الذين ساعدوا في جمع مقاطع الفيديو.
وتم استخدام هذه المقاطع في نظام يسمى GPT-4، والذي يُعتبر واحدًا من أقوى أنظمة الذكاء الاصطناعي في العالم.
وتم تحويل المقاطع الصوتية إلى نصوص باستخدام هذا النظام، والذي يعتبر مصدرًا قويًا للبيانات التي يمكن استخدامها في تدريب النماذج الذكية.
والجدير بالذكر أن OpenAI قامت في عام 2021 بتدريب نماذجها على العديد من مصادر البيانات المفيدة، مثل الأكواد البرمجية في منصة GitHub ومحتوى الواجبات المدرسية في منصة Quizlet وغيرها.
وفي ذلك الوقت، قدمت تحويلات الفيديو والبودكاست والكتب الصوتية في يوتيوب كواحدة من أفضل المصادر المتاحة للبيانات التي يمكن استخدامها في تدريب النماذج الذكية.
وتضمنت أيضا الأكواد البرمجية في منصة Github، ومحتوى الواجبات المدرسية في منصة Quizlet.