نيويورك (ا ف ب) – صانع ChatGPT يغوص الآن في مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
تعرف على سورا — OpenAI مولد جديد لتحويل النص إلى فيديو. وتستخدم الأداة، التي كشفت عنها شركة سان فرانسيسكو يوم الخميس، الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو قصيرة على الفور بناءً على أوامر مكتوبة.
سورا ليس أول من أظهر هذا النوع من التكنولوجيا. لكن محللي الصناعة يشيرون إلى الجودة العالية لمقاطع الفيديو الخاصة بالأداة المعروضة حتى الآن، ويلاحظون أن طرحها يمثل قفزة كبيرة لكليهما. OpenAI ومستقبل تحويل النص إلى فيديو بشكل عام.
ومع ذلك، كما هو الحال مع كل الأشياء في مجال الذكاء الاصطناعي سريع النمو اليوم، تثير هذه التكنولوجيا أيضًا مخاوف بشأن الآثار الأخلاقية والمجتمعية المحتملة. إليك ما تحتاج إلى معرفته.
ما هو سورا؟ هل يمكنني استخدامه بعد؟
Sora هو منشئ تحويل النص إلى فيديو – حيث يقوم بإنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية بناءً على مطالبات مكتوبة باستخدام الذكاء الاصطناعي التوليدي. يمكن للنموذج أيضًا إنشاء فيديو من صورة ثابتة موجودة.
الذكاء الاصطناعي التوليدي هو فرع من الذكاء الاصطناعي يمكنه إنشاء شيء جديد. تشمل الأمثلة روبوتات الدردشة، مثل ChatGPT من OpenAI، ومولدات الصور مثل DALL-E وMidjourney. يعد الحصول على نظام ذكاء اصطناعي لإنشاء مقاطع فيديو أمرًا أحدث وأكثر تحديًا ولكنه يعتمد على بعض التقنيات نفسها.
Sora ليس متاحًا للاستخدام العام بعد (تقول OpenAI إنها تتواصل مع صانعي السياسات والفنانين قبل إطلاق الأداة رسميًا) وما زال هناك الكثير مما لا نعرفه. ولكن منذ إعلان يوم الخميس، شاركت الشركة عددًا من الأمثلة لمقاطع الفيديو التي أنشأها Sora لإظهار ما يمكنها فعله.
الرئيس التنفيذي لشركة OpenAI سام التمان كما لجأت أيضًا إلى X، المنصة المعروفة سابقًا باسم Twitter، لتطلب من مستخدمي وسائل التواصل الاجتماعي إرسال أفكار سريعة. وقام لاحقًا بمشاركة مقاطع فيديو مفصلة بشكل واقعي استجابت لمطالبات مثل “اثنين من المستردين الذهبيين”. البث على قمة الجبل ” و”أ سباق دراجات على المحيط مع حيوانات مختلفة مثل الرياضيين الذين يركبون الدراجات الهوائية من خلال عرض كاميرا بدون طيار.
في حين أن مقاطع الفيديو التي أنشأها Sora يمكن أن تصور مشاهد معقدة ومفصلة بشكل لا يصدق، تشير OpenAI إلى أنه لا تزال هناك بعض نقاط الضعف – بما في ذلك بعض العناصر المكانية وعناصر السبب والنتيجة. على سبيل المثال، تضيف شركة OpenAI على موقعها الإلكتروني: “قد يأخذ الشخص قضمة من ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون لملف تعريف الارتباط علامة قضمة”.
هل هناك أدوات فيديو أخرى تم إنشاؤها بواسطة الذكاء الاصطناعي متاحة اليوم؟
إن Sora من OpenAI ليس الأول من نوعه. تعد Google وMeta والشركة الناشئة Runway ML من بين الشركات التي أظهرت تقنية مماثلة.
ومع ذلك، يؤكد محللو الصناعة على الجودة الواضحة والطول المذهل لمقاطع فيديو Sora التي تمت مشاركتها حتى الآن. وقال فريد هافيماير، رئيس قسم الذكاء الاصطناعي وأبحاث البرمجيات في ماكواري بالولايات المتحدة، إن إطلاق Sora يمثل خطوة كبيرة إلى الأمام بالنسبة لهذه الصناعة.
وقال هافيماير: “لا يمكنك فقط إنشاء مقاطع فيديو أطول، فأنا أفهم ما يصل إلى 60 ثانية، ولكن أيضًا مقاطع الفيديو التي يتم إنشاؤها تبدو طبيعية أكثر ويبدو أنها تحترم الفيزياء والعالم الحقيقي أكثر”. “إنك لا تحصل على عدد كبير من مقاطع الفيديو أو أجزاء “الوادي الخارق” في خلاصات الفيديو التي تبدو… غير طبيعية.”
على الرغم من أنه كان هناك “تقدم هائل” في الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي خلال العام الماضي – بما في ذلك تقديم Stable Video Diffusion في نوفمبر الماضي – قال روان كوران، كبير المحللين في شركة Forrester، إن مقاطع الفيديو هذه تتطلب المزيد من “الدمج معًا” من أجل اتساق الشخصية والمشهد.
ومع ذلك، فإن اتساق مقاطع الفيديو الخاصة بسورا وطولها يمثل “فرصًا جديدة للمبدعين لدمج عناصر الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي في محتوى أكثر تقليدية، والآن حتى لإنشاء مقاطع فيديو سردية كاملة من واحد أو عدد قليل من المطالبات،” كما قال كوران لصحيفة The The Guardian. وكالة أسوشيتد برس عبر البريد الإلكتروني الجمعة.
ما هي المخاطر المحتملة؟
على الرغم من أن قدرات سورا أذهلت المراقبين منذ إطلاقه يوم الخميس، إلا أن القلق بشأن الآثار الأخلاقية والمجتمعية لاستخدامات الفيديو التي يولدها الذكاء الاصطناعي لا يزال قائمًا أيضًا.
يشير هافيماير إلى المخاطر الكبيرة التي تنطوي عليها الدورة الانتخابية لعام 2024، على سبيل المثال. وأضاف أن وجود طريقة “سحرية محتملة” لإنشاء مقاطع فيديو قد تبدو واقعية يطرح عددًا من القضايا داخل السياسة وخارجها – مشيرًا إلى مخاوف الاحتيال والدعاية والمعلومات المضللة.
وقال هافيميير: “إن العوامل الخارجية السلبية للذكاء الاصطناعي التوليدي ستكون موضوعًا حاسمًا للنقاش في عام 2024”. “إنها مشكلة جوهرية سيتعين على كل شركة وكل شخص مواجهتها هذا العام.”
لا تزال شركات التكنولوجيا هي صاحبة القرار عندما يتعلق الأمر بإدارة الذكاء الاصطناعي ومخاطره، حيث تعمل الحكومات في جميع أنحاء العالم على اللحاق بالركب. وفي ديسمبر/كانون الأول، توصل الاتحاد الأوروبي إلى اتفاق بشأن أول قواعد الذكاء الاصطناعي الشاملة في العالم، لكن الفعل لن يدخل حيز التنفيذ إلا بعد مرور عامين على الموافقة النهائية.
وفي يوم الخميس، قالت OpenAI إنها تتخذ خطوات سلامة مهمة قبل إتاحة Sora على نطاق واسع.
وكتبت الشركة: “نحن نعمل مع أعضاء الفريق الأحمر – خبراء المجال في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز – الذين سيختبرون النموذج بشكل عدائي”. “نحن أيضًا نبني أدوات للمساعدة في اكتشاف المحتوى المضلل مثل مصنف الكشف الذي يمكنه معرفة متى تم إنشاء مقطع فيديو بواسطة Sora.”
وقد كررت آنا ماكانجو، نائبة رئيس الشؤون العالمية في OpenAI، ذلك عندما تحدثت يوم الجمعة في المؤتمر مؤتمر ميونيخ للأمن، حيث تعهدت OpenAI و19 شركة تكنولوجية أخرى بالعمل معًا طوعًا لمكافحة التزييف العميق للانتخابات الناتج عن الذكاء الاصطناعي. وأشارت إلى أن الشركة أطلقت سراح سورا “بطريقة حذرة للغاية”.
وفي الوقت نفسه، كشفت OpenAI عن معلومات محدودة حول كيفية بناء Sora. ولم يكشف التقرير الفني لشركة OpenAI عن مصادر الصور والفيديو المستخدمة لتدريب Sora، ولم تستجب الشركة على الفور لطلب مزيد من التعليق يوم الجمعة.
يصل إصدار Sora أيضًا وسط خلفية الدعاوى القضائية ضد OpenAI وشريكتها التجارية Microsoft من قبل بعض المؤلفين و اوقات نيويورك بسبب استخدامه للأعمال الكتابية المحمية بحقوق الطبع والنشر لتدريب ChatGPT. تدفع OpenAI رسومًا غير معلنة إلى AP لرخصة أرشيف الأخبار النصية الخاصة به.
___
أفاد أوبراين من بروفيدنس، رود آيلاند.