الشركة المطورة لـChatGPT تسقط في مصيدة دعاوى «حقوق الملكية»
تعيش شركة OpenAI أزمة مع المطالبين بحقوق الملكية الفكرية، لما تتبعه من نهم في استخدام جميع البيانات المتاحة للعامة لتدريب ChatGPT، بما في ذلك الكتب والمقالات من الإنترنت.
والآن، يريد المؤلفون الذين يملكون حقوق الملكية لهذا المحتوى الأدبي أن يحصلوا على أجر مقابل استفادة شركة OpenAI عملهم.
وتعد بيانات التدريب جزءًا أساسيًا من إنشاء نماذج الذكاء الاصطناعي التي تسيطر على عالم التكنولوجيا الآن وفي مقدمتها، ChatGPT.
سعي للتطوير على حساب الناشرين
تسعى شركات التكنولوجيا الرائدة مثل Google، وMeta، وOpenAI، وAnthropic، وMicrosoft جاهدة للعثور على مصادر جديدة للبيانات باستمرار.
حتى أن شركة Meta فكرت في وقت ما في شراء Simon & Schuster، إحدى أكبر دور النشر في العالم لتغذية نماذجها المحتملة من الذكاء الاصطناعي بالبيانات.
ويكمن جزء من المشكلة في أن الناشرين يتهمون هذه الشركات بشكل متزايد بجمع البيانات المحمية بحقوق الطبع والنشر، حتى تحول الأمر للقضاء، بملاحقة الناشرين شركات تطوير أنظمة الذكاء الاصطناعي قضائيا لرغبتهم في الحصول على أجر مقابل عملهم.
وفي مقابل هذه الادعاءات، قالت كل من Meta وOpenAI فيما يخص الدعاوى المقدمة إلى مكتب حقوق الطبع والنشر الأمريكي بأن وضع المواد المحمية بحقوق الطبع والنشر على الإنترنت يجعلها "متاحة للعامة" وبالتالي تحت الاستخدام العادل.
لكن لا يزال يتعين عليهم تقديم هذه الحجة في المحكمة حيث تواجه شركة OpenAI تحديدا، دعاوى قضائية من عدة مجموعات من الناشرين بشأن المواد المحمية بحقوق الطبع والنشر.
وبحسب "بيزنس إنسايدر"، قام مركز التقارير الاستقصائية، وهو منظمة إخبارية غير ربحية تُعرف أحيانًا باسمها المختصر CIR، والتي اندمجت مع Mother Jones وReveal في وقت سابق من هذا العام، برفع دعوى قضائية ضد OpenAI وMicrosoft الأسبوع الماضي في المحكمة الفيدرالية.
تتهم الدعوى شركة OpenAI بأنها مبنية على استغلال الأعمال المحمية بحقوق الطبع والنشر المملوكة للمبدعين في جميع أنحاء العالم، بما في ذلك CIR.
سلوك الاستفادة المجانية
اتهم محامو CIR شركة OpenAI وMicrosoft باستخدام مواد محمية بحقوق الطبع والنشر من شركة Mother Jones لتدريب نماذج GPT وCopilot AI الخاصة بهما.
وقالت مونيكا باورلين، الرئيس التنفيذي لمركز التقارير الاستقصائية، في بيان، "بدأت OpenAI و Microsoft في تفريغ قصصنا لجعل منتجهم أكثر قوة، لكنهم لم يطلبوا أبدًا الإذن أو يعرضوا تعويضًا، على عكس المنظمات الأخرى التي ترخص المواد الخاصة بنا".
حول الدعوى قالت "بارولين"، "إن سلوك الاستفادة المجانية هذا ليس غير عادل فحسب، بل إنه انتهاك لحقوق الطبع والنشر."
وتقول الدعوى القضائية إن "16,793 عنوان URL مميزًا من نطاق الويب الخاص بشركة Mother Jones" ظهر في قائمة منشورة تضم أفضل نطاقات الويب الموجودة في مجموعة تدريب WebText الخاصة بالشركة.
ملاحقات قضائية بالجملة
وفي دعوى جماعية أخرى من نقابة المؤلفين، ادعى مؤلفان أن شركة OpenAI استخدمت معلومات من كتبهما لتدريب ChatGPT.
كما رفعت صحيفة نيويورك تايمز دعوى قضائية مماثلة ضد الشركة في ديسمبر/كانون الأول 2023.
وفي شهر مايو/أيار الماضي، كشفت وثائق المحكمة في الدعوى القضائية التي رفعتها نقابة المؤلفين أن OpenAI حذفت مجموعتين ضخمتين من البيانات المستخدمة لتدريب GPT-3.
وقال محامو النقابة إن المجموعتين تحتويان على الأرجح على "أكثر من 100 ألف كتاب منشور".
وتقول وثائق المحكمة إن الموظفين المسؤولين عن تجميع البيانات لم يعودا يعملان لدى OpenAI.
وبدأت OpenAI في توقيع اتفاقيات ترخيص مع المؤسسات الإخبارية لاستخدام عملها بشكل عادل، وقد وقعت الشركة مثل هذه الاتفاقيات مع وكالة أسوشيتد برس، وناشري صحيفة وول ستريت جورنال ونيويورك بوست، وذا أتلانتيك، وبريزا ميديا، وصحيفة لوموند، وفايننشال تايمز، وأكسيل سبرينغر، الشركة الأم لـ Business Insider.
لكن حجم المحتوى المطلوب لهذه الروبوتات للتعلم المستمر سيتطلب أكثر بكثير من مجرد حفنة من اتفاقيات الترخيص.
وأحد الحلول البديلة التي لجأت لها الشركة، هو البيانات الاصطناعية، التي يتم إنشاؤها بشكل مصطنع بدلا من جمعها من العالم الحقيقي، ويمكن توليدها بسهولة عن طريق خوارزميات التعلم الآلي.
وقد اعتبرت شركة OpenAI البيانات الاصطناعية خيارًا لتدريب نماذجها، لكن الرئيس التنفيذي سام ألتمان أثار مخاوف بشأن إنتاج بيانات عالية الجودة.
وقال ألتمان في مؤتمر تقني في مايو/أيار 2023، "طالما يمكنك تجاوز أفق البيانات الاصطناعية، حيث يكون النموذج ذكيًا بما يكفي لإنتاج بيانات تركيبية جيدة، فسيكون كل شيء على ما يرام".
واستكشفت الشركة أيضًا عملية في تعلم نماذج الذكاء الاصطناعي معًا، إذ ينتج أحد أنظمة الذكاء الاصطناعي البيانات، بينما يحكم عليها نظام آخر.
aXA6IDMuMTQzLjIzLjM4IA== جزيرة ام اند امز