لم يعد الذكاء الاصطناعي مجرد “سباغيتي” رقمي عشوائي. في غضون عامين ونصف فقط، شهد توليد الفيديو بالذكاء الاصطناعي تطوراً هائلاً، من صعوبة تصوير مشهد لويل سميث وهو يأكل السباغيتي، وصولاً إلى إنتاج مقاطع فيديو واقعية للغاية. هذا التطور السريع في توليد الفيديو بالذكاء الاصطناعي يثير تساؤلات حول مستقبل صناعة الترفيه وحقوق الملكية الفكرية.
بدأ هذا الاختبار غير الرسمي في عام 2023 عندما نشر مستخدم على موقع Reddit مقطع فيديو لويل سميث وهو يأكل السباغيتي تم إنشاؤه بواسطة ModelScope، وهو نموذج للذكاء الاصطناعي لتحويل النص إلى فيديو. كانت النتائج الأولية مروعة، حيث لم يشبه سميث نجمه السينمائي الشهير، بل ظهر كرسوم متحركة سيئة الصنع، بملامح كاريكاتورية تذكر بأعمال البازارات السياحية. في بعض المقاطع، لم يلتهم سميث السباغيتي مطلقاً، مما فشل في تحقيق أبسط متطلبات الاختبار.
التقدم الملحوظ في تقنيات توليد الفيديو بالذكاء الاصطناعي
أبرزت هذه الإخفاقات القيود المبكرة لتقنيات الذكاء الاصطناعي في توليد الفيديو والصور، والتي أدت أحيانًا إلى ظهور أخطاء تشريحية مثل وجود ثمانية أصابع. علق سميث نفسه على هذا الاختبار في فبراير 2024، ونشر مقطع فيديو على TikTok وهو يأكل السباغيتي بطريقة كاريكاتورية مماثلة للفيديو الأصلي.
لكن الأمور تغيرت بشكل كبير منذ ذلك الحين. ففي عام 2024، قدمت MiniMax، وهي شركة صينية متخصصة في الذكاء الاصطناعي، تصويراً أكثر دقة لسميث، لكن حركة مضغه كانت لا تزال غير طبيعية. وفي نهاية المقطع، ظهرت المعكرونة وكأنها تطفو في الهواء. لاحقاً، نشر مستخدم على منصة X في شهر مايو أنه استخدم Google’s Veo 3 لإنتاج مقطع فيديو جديد، لكن صوت مضغ سميث للسباغيتي بدا مقرمشاً جداً. مقطع فيديو آخر تم إنشاؤه بواسطة Veo 3.1 بدا أكثر واقعية.
Sora تتصدر المشهد
يعتبر نظام Sora من OpenAI حاليًا أفضل مولد للفيديو بالذكاء الاصطناعي في السوق. إنه جيد لدرجة أنه بعد إطلاق Sora 2 وتطبيق TikTok المرافق له في سبتمبر، اضطرت الشركة إلى إضافة المزيد من الضمانات لحماية أوجه التشابه الخاصة بالطرف الثالث وحقوق التأليف والنشر، وذلك بعد سلسلة من الحوادث البارزة التي شملت شخصية سبونج بوب ومارتن لوثر كينغ جونيور. هذه الحوادث سلطت الضوء على أهمية الأمان في الذكاء الاصطناعي.
تسعى Google و xAI التابعة لإيلون ماسك جاهدتين للمنافسة. في يوليو، أطلقت xAI نظام Grok Imagine، وهو مولد الفيديو الخاص بها من النص إلى الفيديو. يتطلب التفوق في هذا المجال حلاً فعالاً لمشكلة واقعية المظهر، أو ما يسمى بـ “الواقعية في الذكاء الاصطناعي“.
قد يكون اجتياز “اختبار السباغيتي” أكثر صعوبة الآن، حيث تكثف هوليوود وغيرهم من حاملي الحقوق جهودهم لمنع شركات الذكاء الاصطناعي من انتهاك حقوقهم. وقبل أيام قليلة من إطلاق Sora 2، رفعت Disney و Universal و Warner Bros وشركات أخرى دعوى قضائية في المحكمة الفيدرالية ضد MiniMax.
كما أقامت شركة Cameo، المتخصصة في إنتاج مقاطع فيديو شخصية، دعوى قضائية ضد OpenAI بسبب قرارها تسمية الميزة الأساسية لتطبيق Sora باسم “cameos”. يعود أحد أسباب قدرة Sora على توليد مقاطع فيديو عالية الجودة، خاصةً لشخصيات غير معروفة، إلى إمكانية تحميل المستخدمين عمليات مسح للوجوه إلى التطبيق، وهي الميزة المعروفة باسم “cameo”. في نوفمبر، قام قاضٍ فدرالي بمنع OpenAI مؤقتًا من استخدام كلمة “cameo”.
وفي الوقت نفسه، في واشنطن، يعرب بعض المشرعين عن استيائهم من قدرة الذكاء الاصطناعي على توليد مقاطع فيديو لهم يتحدثون فيها كلمات لم ينطقوا بها مطلقًا. هذا الأمر يثير مخاوف بشأن التزييف العميق وأثره المحتمل على الخطاب العام.
ومع ذلك، لا يتهرب الجميع من الفيديو الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي. أعلنت Coca-Cola مؤخرًا أنها استخدمت الذكاء الاصطناعي مرة أخرى للمساعدة في إنتاج إعلانها الخاص بالعطلات، مستفيدة هذه المرة من Sora وVeo 3 وLuma AI. يشير هذا إلى أن الشركات قد بدأت في رؤية قيمة في استخدام هذه التقنيات لتسريع عملية الإعلان وتقليل التكاليف.
من المتوقع أن تواصل الشركات تطوير نماذج توليد الفيديو بالذكاء الاصطناعي، مع التركيز بشكل خاص على تحسين الواقعية ومعالجة المخاوف المتعلقة بحقوق الملكية الفكرية. المعركة القانونية بين شركات الذكاء الاصطناعي وحاملي الحقوق من المؤكد أنها ستستمر، ومن المحتمل أن تحدد ملامح مستقبل هذه التكنولوجيا. سيراقب المراقبون عن كثب التطورات التنظيمية في واشنطن، والتي قد تفرض قيودًا إضافية على كيفية استخدام هذه التقنيات.
