• أطلقت Meta للتو Movie Gen، وهو مولد فيديو يعمل بالذكاء الاصطناعي للتنافس مع Sora من OpenAI.
  • يمكن لـ Movie Gen إنشاء مقاطع فيديو مصحوبة بالصوت باستخدام مطالبة نصية. ويمكنه أيضًا التعديل عن طريق المطالبة.
  • انضمت Meta إلى سباق إنشاء الفيديو بعد OpenAI وGoogle.

أصدرت Meta أداة جديدة لإنشاء الفيديو بالذكاء الاصطناعي يوم الجمعة والتي تعد أيضًا أحدث تسديدة للشركة في معركتها مع OpenAI من أجل تفوق الذكاء الاصطناعي.

وقالت الشركة في بيان صحفي: “اليوم، نحن متحمسون للعرض الأول لـ Meta Movie Gen، وهو بحثنا المبتكر في مجال الذكاء الاصطناعي للوسائط، والذي يتضمن طرائق مثل الصور والفيديو والصوت”. “يتفوق Movie Gen على النماذج المماثلة في الصناعة عبر هذه المهام عند تقييمها من قبل البشر.”

في بيانها الصحفي، وصفت ميتا Movie Gen بأنه “مجموعة نماذج سرد القصص الأكثر تقدمًا وغامرة”، بما في ذلك إنشاء الفيديو، وتوليد الصوت، وتوليد الفيديو المخصص، وتحرير الفيديو. وقالت الشركة إنه تم تدريب النماذج باستخدام البيانات المتاحة للجمهور والبيانات المرخصة.

من خلال المطالبة النصية، يمكن لـ Movie Gen إنشاء مقاطع فيديو تصل مدتها إلى 16 ثانية بمعدل 16 إطارًا في الثانية أثناء التفكير “حول حركة الكائن، وتفاعلات الموضوع مع الكائن، وحركة الكاميرا”. يمكن للمستخدمين تحميل صورة لأنفسهم لدمجها في مقاطع الفيديو المخصصة، ويمكن لـ Movie Gen تحرير مقاطع الفيديو بتعليمات نصية من المستخدم.

يُظهر مقطع الفيديو النموذجي الخاص بـ Meta منظورًا تحت الماء لفرس النهر الصغير (إشارة إلى Moo Deng، أي شخص؟) يسبح بسعادة في مشهد مائي هادئ.

ويظهر آخر كوالا على لوح ركوب الأمواج والموجه المصاحب له: “دب كوالا رقيق يركب الأمواج. له معطف رمادي وأبيض وأنف مستدير. لوح ركوب الأمواج أصفر. دب الكوالا يمسك بلوح ركوب الأمواج بمخالبه. الكوالا تعابير وجه الدب مركزة، الشمس مشرقة.”

وقال البيان الصحفي إنه من خلال توليد الصوت، يمكن للمستخدمين “إنشاء وتوسيع المؤثرات الصوتية أو الموسيقى الخلفية أو الموسيقى التصويرية بأكملها” لمدة تصل إلى 45 ثانية. مقطع مثال للثعبان يتضمن الانزلاق عبر منطقة حرجية موجه: “حفيف أوراق الشجر والأغصان المتقصفة، مع مقطوعة موسيقية أوركسترا.”

لقد تأخرت Meta قليلًا في لعبة توليد الصوت والفيديو حيث أن كبار المنافسين مثل OpenAI وGoogle قد حصلوا بالفعل على موطئ قدم في هذا المجال. أطلقت شركة OpenAi مولد الفيديو Sora في شهر فبراير، وحذت شركة Google حذوها مع شركة Veo في شهر مايو.

ومع ذلك، فقد منحت Meta شركة OpenAI فرصة للفوز بأموالها في سباق التسلح للذكاء الاصطناعي. على الرغم من أن ChatGPT من OpenAI ظهر لأول مرة وأطلق الشركة إلى الشهرة العالمية، إلا أن التكرارات الأخيرة لنموذج Meta's Llama لاقت استحسانًا كبيرًا. رأى الكثيرون أن Llama 3.1، الذي صدر في شهر يوليو، يتفوق على GPT-4o من OpenAI، والذي صدر قبل فترة وجيزة.

تقول شركة Meta إن “نماذجها الحديثة” الجديدة تتفوق على المنافسين في مقارنات A/B البشرية. بالنسبة لتوليد الفيديو، فإن أولئك الذين شملهم استطلاع Meta يفضلون Movie Gen على OpenAI Sora، حسبما جاء في البيان الصحفي للشركة. لم تشارك Meta مقارنة A/B مع Veo من Google، والذي يقدم أيضًا مؤثرات صوتية وموسيقى، لكن Meta قالت في ورقة بحثية مطولة مصاحبة إنها تعتقد أن نماذج توليد الفيديو إلى الصوت من Google قد تكون محدودة الطول أكثر من نماذج Meta. .

لم تستجب Meta وOpenAI وGoogle على الفور لطلب التعليق.