- قد يعتقد الرئيس التنفيذي لشركة Google DeepMind أن مولد Sora لتحويل النص إلى فيديو من OpenAI، يتمتع بميزة.
- وذكرت صحيفة ذا إنفورميشن أن ديميس هاسابيس أخبر أحد زملائه أنه سيكون من الصعب على جوجل أن تتعادل مع سورا.
- وتأتي تعليقاته في الوقت الذي تتنافس فيه شركات التكنولوجيا الكبرى في سباق الذكاء الاصطناعي لبناء منتجات منافسة.
قد يعتقد ديميس هاسابيس أن مولد تحويل النص إلى فيديو الخاص بـ OpenAI أكثر تقدمًا من ذلك الذي صنعته شركته الخاصة.
وفقًا للمعلومات، أخبر الرئيس التنفيذي لشركة Google DeepMind مؤخرًا أحد زملائه أنه قد يكون من الصعب على Google الوصول إلى المستوى مع Sora من OpenAI.
يمكن لـ Sora إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة ويمكن أن تتكون من “مشاهد معقدة ذات شخصيات متعددة”، حسبما قالت OpenAI عندما تم الكشف عنها. انتشرت العروض التوضيحية لمقاطع الفيديو التي أنشأها Sora في فبراير، وبدا أنها أثارت إعجاب الكثير من الناس.
لدى جوجل مولد خاص بها لتحويل النص إلى فيديو، Lumiere، والذي كشفت عنه في ورقة بحثية في يناير. يمكنه إنشاء مقاطع مدتها خمس ثوانٍ مع مطالبة نصية.
وقالت الشركة، التي أصدرت مؤخرًا نموذجها التجريبي للذكاء الاصطناعي Gemini 1.5، في الورقة البحثية، إنه من الضروري إنشاء أدوات يمكنها اكتشاف “التحيزات وحالات الاستخدام الضارة” لضمان أمانها.
وذلك لأن هناك “خطر إساءة الاستخدام لإنشاء محتوى مزيف أو ضار” مع Lumiere، وقد واجه مثل هذه المشكلة مع منشئ الصور الخاص بـ Gemini في فبراير. أوقفت Google مؤقتًا طرح منشئ الصور الخاص بها بعد أن أنتجت صورًا لأشخاص ملونين في سياقات غير دقيقة تاريخيًا.
يأتي موقف هاسابيس من شركة Lumiere مقارنةً بـ Sora مع استمرار شركات التكنولوجيا الكبرى في سباق الذكاء الاصطناعي مع المنتجات المنافسة. لكن تأمين النصر يتوقف على الحصول على كمية كبيرة من البيانات لتغذية أنظمتهم ودفع التكنولوجيا إلى الأمام.
وقالت ميرا موراتي، كبيرة مسؤولي التكنولوجيا في OpenAI، لصحيفة وول ستريت جورنال الشهر الماضي إنها لا تعرف ما إذا كان سورا قد تم تدريبه على مقاطع فيديو يوتيوب.
ثم أخبر الرئيس التنفيذي لموقع YouTube، نيل موهان، وكالة Bloomberg الأسبوع الماضي أنه ليس لديه علم بما إذا كانت OpenAI تستخدم محتوى YouTube لتدريب مولد الفيديو الخاص بها. وأضاف أن القيام بذلك سيكون بمثابة “انتهاك واضح” لشروط خدمة المنصة.
ذكرت صحيفة نيويورك تايمز الأسبوع الماضي أن OpenAI استخدمت مقاطع فيديو على YouTube للمساعدة في تحسين أداة التعرف على الكلام Whisper، نقلاً عن مصادر لم تسمها.
وفقًا للتقرير، قامت OpenAI بنسخ أكثر من مليون ساعة من مقاطع فيديو YouTube وتم إدخال النص المكتوب في نموذج GPT-4 الخاص بها.
وذكرت صحيفة التايمز أن جوجل استخدمت أيضًا موقع يوتيوب لنسخ مقاطع الفيديو وتدريب نماذج الذكاء الاصطناعي الخاصة بها. قد يؤدي القيام بذلك إلى انتهاك حقوق الطبع والنشر التي يملكها منشئو المحتوى.
لم يستجب Google DeepMind وOpenAI على الفور لطلبات التعليق من Business Insider، والتي تم تقديمها خارج ساعات العمل العادية.