Voice Engine.. الرعب القادم من الذكاء الاصطناعي
كشفت شركة OpenAI عن أداة جديدة للذكاء الاصطناعي يمكنها تقليد الأصوات البشرية بدقة مذهلة.
بما يثير أيضًا مخاوف بشأن المعلومات الخاطئة وغيرها من أشكال سوء الاستخدام.
ونشرت OpenAI مؤخرا عينات من الاختبارات المبكرة للأداة، التي تسمى Voice Engine، والتي تستخدم عينة مدتها 15 ثانية لشخص يتحدث لإنشاء نسخة مقنعة من صوته، أو ما يعرف بالبصمة الصوتية.
ويمكن بعد ذلك تقديم فقرة من النص وستقوم الأداة بقراءتها بصوت تم إنشاؤه بواسطة الذكاء الاصطناعي.
ويمكن لـ Voice Engine استخدام عينة صوتية بلغة واحدة لإنشاء نسخة صوتية يمكنها التحدث بعدة لغات أخرى.
يتضمن منشور مدونتها مثالاً لمقطع صوتي لإنسان يقرأ فقرة عن الصداقة، إلى جانب الصوت الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والذي يبدو وكأنه نفس الشخص يقرأ نفس المقطع باللغات الإسبانية والماندرين والألمانية والفرنسية واليابانية. وفي كل عينة من العينات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، يتم الحفاظ على نغمة ولهجة المتحدث الأصلي.
مهارة خاصة
وهناك العديد من الخدمات الصوتية المولدة بواسطة الذكاء الاصطناعي متاحة بالفعل للجمهور، ولكن كما فعلت مع برنامج الدردشة الآلي ChatGPT، أثبتت OpenAI مهارة خاصة في الحصول على اعتماد واسع النطاق لأدوات الذكاء الاصطناعي.
تقول الشركة إن أداة تحويل النص إلى صوت المدعومة بالذكاء الاصطناعي يمكن أن تساعد في الترجمة أو مساعدة القراءة للأطفال أو مساعدة الأشخاص الذين فقدوا القدرة على التحدث. لكن بعض المتشككين يشعرون بالقلق من أن ذلك قد يؤدي أيضًا إلى خلق معلومات مضللة أو تسهيل ارتكاب عمليات الاحتيال.
ضوابط للثقة
وتقول OpenAI إن Voice Engine يُستخدم حاليًا من قبل "مجموعة صغيرة من الشركاء الموثوق بهم"، بما في ذلك شركات التعليم والتكنولوجيا الصحية، وستستخدم اختباراتهم لتحديد ما إذا كان سيتم السماح باستخدام أكثر انتشارًا وكيفية ذلك. وقد وافق هؤلاء المختبرون على عدم إعادة إنشاء أصوات الأشخاص دون موافقتهم الصريحة، وأن يحددوا بوضوح للمستمعين أن ما يسمعونه هو ناتج عن الذكاء الاصطناعي، وفقًا للشركة.
وقالت OpenAI في تدوينة: "نحن ندرك أن توليد خطاب يشبه أصوات الناس ينطوي على مخاطر جسيمة، وهو ما يتصدر أولوياتنا بشكل خاص في عام الانتخابات".
كما قالت "يجب أن يكون أي نشر واسع النطاق لتقنية الصوت الاصطناعي مصحوبًا بتجارب مصادقة صوتية تتحقق من أن المتحدث الأصلي يدلي ببصمته الصوتية عن عمد، وقائمة صوت محظورة تكتشف وتمنع إنشاء أصوات مشابهة جدًا للأصوات البارزة".
تأتي معاينة Voice Engine في الوقت الذي ينتظر فيه المستخدمون الإصدار العام لـ Sora، أداة الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي قامت OpenAI بالتشويق لها الشهر الماضي. يمكن لـ Sora إنشاء مقاطع فيديو ذات مظهر واقعي مدتها 60 ثانية.
بشكل منفصل، أعلنت OpenAI أيضًا الاثنين الماضي أنها ستجعل ChatGPT متاحًا لأي شخص دون الحاجة إلى التسجيل لاستخدام الخدمة.
أشارت الشركة إلى أنها قد تستخدم أي نص يتم تحميله في ChatGPT لتحسين نماذجها، لكنها قالت إنه يمكن إيقاف هذا من خلال الإعدادات حتى بدون حساب. ومع ذلك، بدون حساب، لن يتمكن المستخدمون من حفظ أو مراجعة سجل الدردشة أو الوصول إلى الميزات المتنوعة، بما في ذلك المحادثات الصوتية والتعليمات المخصصة.