- يقوم محامو صحيفة نيويورك تايمز بدراسة الكود المصدري والمواد التدريبية الخاصة بـ ChatGPT.
- تحاول قضايا حقوق الطبع والنشر من الناشرين والمؤلفين معرفة كيفية تدريب الذكاء الاصطناعي على العمل الإبداعي.
- ومن الممكن أن ترسم هذه الدعاوى القضائية مساراً للمضي قدماً، مثلما حدث في المستنقع القانوني الذي شهدته شركة نابستر قبل عقدين من الزمن.
في مكان ما في الولايات المتحدة، في غرفة آمنة، على جهاز كمبيوتر غير متصل بالإنترنت، يوجد الكود المصدري لـ ChatGPT.
ومن المقرر أن يقوم محامو صحيفة نيويورك تايمز بفحصه.
وبأمر من قاض فيدرالي، لا يمكن للمحامين دخول الغرفة إلا إذا أظهروا بطاقة هوية صادرة عن الحكومة لحارس الأمن. ويُمنع عليهم إحضار هواتفهم الخاصة أو محركات الأقراص المحمولة أو أي أجهزة إلكترونية أخرى. ويتم منحهم جهاز كمبيوتر – غير متصل بالإنترنت أيضًا – مزودًا ببرنامج معالجة النصوص. بعد كل جلسة، يمكن تنزيل ملاحظاتهم على جهاز كمبيوتر مختلف، ومن ثم قد يتم مسح جهاز الكمبيوتر الأصلي الخاص بتدوين الملاحظات.
يمكن لمحامي التايمز مشاركة ملاحظاتهم مع ما يصل إلى خمسة مستشارين خارجيين لمساعدتهم على فهم ما تفعله المدونة. إذا أراد أحد المحامين أن يُظهر للرئيس التنفيذي لشركة OpenAI، سام ألتمان، مقتطفًا من الكود ليطرح عليه أسئلة حوله للإدلاء بالشهادة، فسيتم إتلاف تلك النسخة بعد ذلك.
تبلغ قيمة OpenAI 157 مليار دولار ويعود الفضل في ذلك إلى حد كبير إلى نجاح ChatGPT. ولكن لبناء برنامج الدردشة الآلي، قامت الشركة بتدريب نماذجها على كميات هائلة من النصوص التي لم تدفع مقابلها فلسا واحدا.
يتضمن هذا النص قصصًا من صحيفة نيويورك تايمز، ومقالات من منشورات أخرى، وعددًا لا يحصى من الكتب المحمية بحقوق الطبع والنشر.
يعد فحص الكود الخاص بـ ChatGPT، وكذلك نماذج الذكاء الاصطناعي من Microsoft المبنية باستخدام تقنية OpenAI، أمرًا بالغ الأهمية بالنسبة لدعاوى انتهاك حقوق الطبع والنشر المرفوعة ضد الشركتين.
رفع الناشرون والفنانون حوالي عشرين دعوى قضائية كبرى بشأن حقوق الطبع والنشر ضد شركات الذكاء الاصطناعي المنتجة. إنهم يبذلون قصارى جهدهم للمطالبة بشريحة من الكعكة الاقتصادية التي جعلت OpenAI اللاعب المهيمن في الصناعة والتي دفعت تقييم مايكروسوفت إلى ما هو أبعد من 3 تريليون دولار. قد يضع القضاة الذين يبتون في هذه القضايا المعايير القانونية لكيفية تدريب النماذج اللغوية الكبيرة في الولايات المتحدة.
قال متحدث باسم التايمز لـ BI: “يجب على المطورين أن يدفعوا مقابل محتوى الناشر القيم الذي يتم استخدامه لإنشاء منتجاتهم وتشغيلها”. “إن النجاح المستقبلي لهذه التكنولوجيا لا ينبغي أن يأتي على حساب المؤسسات الصحفية.”
بالنسبة للدعوى القضائية، استعانت الشركة الإعلامية التي يبلغ عمرها 173 عامًا بشركة محاماة من النخبة، وهي سوزمان جودفري، التي فازت مؤخرًا بتسوية ضخمة بقيمة 787.5 مليون دولار لشركة دومينيون من فوكس نيوز. وقد تم رفع دعاوى قضائية أخرى من غرف الأخبار، بما في ذلك صحيفة نيويورك ديلي نيوز وماذر جونز، على هذه القضية.
وتمثل سوسمان جودفري أيضًا مجموعة من المؤلفين، من بينهم جورج آر آر مارتن، وجودي بيكولت، وتا-نيهيسي كوتس، الذين قدموا مطالبات بحقوق الطبع والنشر قبل أشهر من ظهور التايمز. إذا شهد القاضي حالة الدعوى الجماعية، فقد يكون للتسوية أو الحكم النهائي تداعيات على كل مؤلف وفنان تقريبًا تم استخدام أعماله لتدريب نماذج الذكاء الاصطناعي.
في 12 سبتمبر/أيلول، احتشد العشرات من المحامين من شركات التكنولوجيا والصحافة في قاعة المحكمة في مانهاتن السفلى لمعرفة أفضل طريقة لتقسيم عملية الاكتشاف، بما في ذلك فحص كود ChatGPT وبيانات التدريب. وما زالوا، جنبًا إلى جنب مع محاميي أصحاب البلاغ، يقررون من يمكنهم عزله وكيفية جدولة موعد الإفادات.
وقالت كريستيليا غارسيا، أستاذة قانون الملكية الفكرية في كلية الحقوق بجامعة جورج تاون: “إنه أمر مثير بالنسبة لأساتذة القانون الذين يعملون في مجال حقوق الطبع والنشر”.
وضع القواعد
مع تراجع الكونجرس عن تنظيم الذكاء الاصطناعي، تتوقع الصناعة أن تضع المحاكم القواعد – أو كما تأمل ألا تضعها.
أبرم العديد من الناشرين، بما في ذلك مالك Business Insider Axel Springer، صفقات مع شركات الذكاء الاصطناعي المنتجة لمشاركة المحتوى الخاص بهم للتدريب على LLM.
إن نطاق وموارد الدعوى التي رفعتها صحيفة التايمز تجعلها مرشحة محتملة لمحكمة عليا تشكل سابقة. وينظر المحامون أيضًا إلى الدعاوى القضائية الجماعية التي رفعها المؤلفون، بالإضافة إلى قضية صناعة الموسيقى ضد أنثروبيك، باعتبارها قضايا تستحق المشاهدة.
قال غارسيا: “نيويورك تايمز هي قوة صحفية هائلة”. “إنه كبير، ويحتوي على الكثير من المحتوى. وربما الأهم من ذلك، أنه يتمتع بقوة سوقية كبيرة وراء هذا المحتوى.”
تقول الدعوى القضائية إن OpenAI انتهكت حقوق الملكية الفكرية الخاصة بها بطريقتين.
هناك قضية “الإدخال” – التي تزعم أن LLM قامت بشكل غير قانوني بجمع أكثر من 10 ملايين مقالة في صحيفة نيويورك تايمز لتدريب ChatGPT وMicrosoft Copilot دون تعويض. وقضية “الإخراج” – بحجة أنه عندما يُطلب من ChatGPT، يمكنه نشر مقالة في صحيفة نيويورك تايمز والتي كان القراء سيدفعون اشتراكًا لها.
في ملفات المحكمة، استشهد المحامون مرارًا وتكرارًا بشركة Napster، التي نسخت بشكل غير قانوني ملايين الأغاني وجعلتها متاحة مجانًا. وبالمثل، استخدمت OpenAI مقالات عالية الجودة ومدروسة ومكتوبة بشكل جيد ومبنية على الحقائق في صحيفة نيويورك تايمز لجعل ChatGPT مثيرًا للإعجاب، كما تقول الصحيفة.
إذا كان هناك أي شيء، فإن OpenAI أسوأ، وفقًا لجوستين نيلسون، محامي سوسمان جودفري الذي يمثل المؤلفين في دعوى جماعية موازية لقضية تايمز وفي قضية مماثلة ضد أنثروبيك.
كان نابستر مشروعًا من طلاب الجامعات؛ OpenAI مدعوم من Microsoft وتبلغ قيمته بالفعل المليارات.
وقال نيلسون لـ BI: “بدلاً من الأطفال، كانت شركة متطورة”. “وبدلاً من القيام بذلك لاستخدامهم الشخصي، كانوا يفعلون ذلك لتحقيق مكاسب تجارية.
لم يستجب ممثلو OpenAI وMicrosoft لطلبات التعليق من Business Insider. وفي المحكمة، يجادلون بأن المبدأ القانوني “للاستخدام العادل” يحمي كيفية استيعاب نماذجهم للمقالات. ويقولون إن مخرجات ChatGPT التي تحتوي على نسخ شبه حرفية من مقالات التايمز كانت نتائج “شاذة للغاية” ولا تمثل كيفية استخدام التطبيق.
تمت مقاضاة شركة نابستر وحذفها من الوجود، لكنها ألهمت صناعة الموسيقى لتبني ملفات MP3، وفي نهاية المطاف، البث المباشر – الذي يستخدم الآن في كل شيء بدءًا من ألعاب الفيديو وحتى الأفلام. استشهد دانيال إيك، أحد مؤسسي Spotify، بـ Napster كمصدر إلهام، وأشاد شون باركر، أحد مؤسسي Napster، بـ Spotify كخليفة.
قد تحدد الدعاوى القضائية المتعلقة بحقوق الطبع والنشر المرفوعة من المنظمات الصحفية وتيرة جميع مولدي الذكاء الاصطناعي، كما توقع غارسيا، الذي عمل في صناعة الموسيقى لمدة عقد من الزمن. الذكاء الاصطناعي ليس جيدًا بشكل خاص في إنتاج الأفلام أو إعداد التقارير، لكنه يمكنه تقليد الصحافة بشكل مقنع.
قال غارسيا: “الصحافة هي بمثابة طائر الكناري في منجم الفحم”. “بنفس الطريقة التي كانت بها الموسيقى بمثابة طائر الكناري في أيام نابستر، لأن الناس كان بإمكانهم بسهولة تحميل ملفات MP3 عبر التورنت. لكن لم يكن بإمكانك، في ذلك الوقت، تحميل فيلم بسهولة عبر التورنت.”
ونظراً للعدد الهائل من الأشخاص المتورطين، فإن الدعاوى القضائية التي رفعها المؤلفون يمكن أن يكون لها تأثير أكثر دراماتيكية. التسوية أو الحكم يمكن أن يغير نماذج الأعمال.
وقال ماثيو ساج، أستاذ القانون بجامعة إيموري الذي يدرس قانون حقوق النشر والذكاء الاصطناعي: “يصبح الناس مبدعين في تسويات الدعاوى الجماعية”. “يمكنك اقتطاع مؤلفي أمريكا مقابل نسبة مئوية من الأسهم أو شيء من هذا القبيل.”
كود المصدر
إن طبيعة تكنولوجيا الذكاء الاصطناعي التوليدي نفسها تكمن في قلب النزاعات المتعلقة بحقوق الطبع والنشر.
ماذا يحدث بالفعل عندما “يتعلم” نموذج لغة كبير كتابًا أو مقالًا إخباريًا؟ ماذا يحدث عندما يقوم ChatGPT بالتنقيب في النموذج للإجابة على استعلام؟ هل تقوم العملية بإنشاء “نسخة” بأي معنى للكلمة؟ أم أن بيانات التدريب مجرد جزء من مجموعة كبيرة من الآحاد والأصفار التي لم تعد تشبه أعمالًا معينة بشكل مفيد؟
يحاول المحامون والمستشارون الذين يتصفحون كود ChatGPT الإجابة على هذه الأسئلة. كما يقومون أيضًا بفحص بيانات تدريب LLM ويخططون لسؤال المديرين التنفيذيين والمبرمجين الرئيسيين في OpenAI – تحت القسم – عن كيفية عمل النماذج.
بمجرد قراءة القانون وأخذ الإفادات، سيكون الأطراف في وضع أفضل للتجادل حول “الاستخدام العادل”، وهو مبدأ قانوني صعب السمعة يحمي استخدام الإبداعات “التحويلية” المستمدة من المواد المحمية بحقوق الطبع والنشر.
إذا كانت شركة OpenAI تقوم بالفعل بصنع نسخ من الكتب والمقالات الإخبارية، على طريقة نابستر، فهل تكون عملية التدريب التحويلية بالقدر الكافي لاعتبارها “استخدامًا عادلاً”؟ القضاة في جميع أنحاء البلاد “في جميع أنحاء الخريطة” في البت في قضايا حقوق الطبع والنشر للاستخدام العادل، وفقًا لكريستا ليزر، أستاذ قانون الملكية الفكرية في جامعة ولاية كليفلاند، مما يضع حصصًا عالية ولا يمكن التنبؤ بها.
وقال ليزر لـ BI: “أعتقد أن هذا سيكون السؤال الكبير في نهاية المطاف والذي سيصل إلى المحكمة العليا”. “إن مسألة الاستخدام العادل هذه تتعلق ببيانات التدريب والاستيعاب والتدريب.”
أحد الأسئلة الرئيسية حول “الاستخدام العادل” هو ما إذا كانت إبداعات ChatGPT تتنافس مع الأعمال الصحفية الأصلية – وهي قضية ملحة للمؤسسات الإخبارية.
وقال غارسيا: “ناشرو الأخبار هم أول من جلب هذه الدعاوى الكبيرة لأن لديهم المزيد على المحك”.
لتقديم مطالبة بحقوق الطبع والنشر، لا يمكن للمدعي أن يشير فقط إلى مجموعة من الأعمال المستخدمة كمصدر إلهام. يجب أن يشير إلى عمل محدد يقولون إنه تم نسخه.
وأرفقت صحيفة نيويورك تايمز في الدعوى القضائية التي رفعتها عشرات الآلاف من الصفحات من المعروضات التي تحتوي على 10,553,897 مقالة. وتقول إن OpenAI وMicrosoft انتهكا بشكل غير قانوني حقوق الطبع والنشر لكل منهما.
ومن بين هذه المقالات قصة تعود إلى عام 2001، بعد وقت قصير من حكم محكمة الاستئناف ضد نابستر، حيث سأل أحد الصحفيين المستخدمين عما سيفعلونه. لقد اتفقوا جميعا على أنه لا عودة إلى الوراء.
وقال أحد المستخدمين للمراسل: “إذا تم إغلاق نابستر، فسيكون هناك المزيد من المواقع”. «وقد يحصلون على القليل منهم، لكنهم لا يستطيعون إيقافهم جميعًا».