يستند هذا المقال كما قيل إلى محادثة مع بول تريللو، وهو فنان ومخرج أفلام مقيم في لوس أنجلوس والذي تجاربه مع OpenAI سورا أنتجت مقاطع فيديو مثل “Abstract” و”The Golden Record”. تم تعديل ما يلي من أجل الطول والوضوح.
لقد قمت باختبار سورا منذ نهاية فبراير. لقد كنت مهتمًا بمحاولة العثور على أفكار وصور كان من الصعب أو الغريب استكشافها بالطرق التقليدية. لذا فأنا أقوم بعمل فيديو موسيقي يحمل منطق الحلم حيث تدور أحداثه على مدى عدة عقود، ونحن نمزج البيئات معًا. إنها فكرة راودتني منذ حوالي 10 سنوات ولكن لم أتمكن من تنفيذها أبدًا لأنها كانت طموحة للغاية.
تمر كل مطالبة في Sora بتكرارات متعددة. الكثير من الأشياء التي كنت أفعلها هي محاولة الحصول على حركات محددة للكاميرا موجهة أو ديناميكية بالإضافة إلى الجمالية. لذلك أرى ما إذا كان بإمكاني إنشاء الموضوع الذي أطلبه، وهو لا يفهم حقًا كل شيء. في بعض الأحيان، قد تختلط الأفكار معًا وتحدث نوعًا من التحور فيما تطلبه.
ثم لدي مجموعة من الكلمات التي أستخدمها للتأكد من أنها أقل شبهاً بلعبة فيديو وأكثر فيلمية. ولكن حتى بعض الكلمات ستجعل الأمور تبدو وكأنها لعبة فيديو. ولذا فأنت تحارب كلمات معينة بكلمات مضادة لمحاولة معرفة ما إذا كان بإمكانك تحقيق الجمالية التي تريدها. أرمي “35 ملم”، أرمي “عدسة بصرية مشوهة”، “مقالة عمق عدسة المجال الصغيرة”، “فيلم فوجي”، “تناظري للأسهم”. إذا لم تقم بإدخال أي شيء، فسيتم تعيينه افتراضيًا على هذا الإخراج ذي المظهر الرقمي للغاية.
بدأت إحدى المطالبات لـ “السجل الذهبي”: “لقطة فيلم تناظري متقلبة نقوم بتكبيرها بشكل ضبابي للمناظر الطبيعية النيزكية الصخرية المتقلبة للأرض الخام مع سجل ذهبي يرتفع عبر أعماق الفضاء المظلمة والصخور السريالية العائمة والدخان يملأ الهواء. المشهد فوضوية وبدائية، مع إطلاق العنان للقوة التدميرية للطبيعة.” (قم بالتمرير إلى النهاية لقراءة المطالبة الكاملة.)
كل شيء يجب أن يحصل على ختم الموافقة قبل نشره للعامة. لديهم كل هذه الضمانات – لا يوجد عُري أو عنف أو شبه أو أي شيء من الواضح أنه محمي بحقوق الطبع والنشر. بعضها وقائي للغاية. إنه أمر محير بالنسبة لنا كمختبري ألفا ما هي الأعلام التي يتم رفعها. ولكن لا يزال بإمكانك فعل الكثير معها. ما يفعله هذا هو أنه يسمح لي بتجربة الأفكار دون أي مخاطر. إنها متحررة بشكل لا يصدق.
لقد سألني الكثير من الأشخاص في عالم الإعلانات، “مرحبًا، كيف يمكنني الانضمام إلى سورا؟” من المحتمل أن تكون هذه هي حالة الاستخدام الأكثر مللاً لاستخدام هذه التكنولوجيا المذهلة في الإعلانات التجارية كبديل لشيء يمكن القيام به بطريقة أخرى.
سورا أبعد ما يكون عن الاستعداد لهوليوود
من وجهة نظر قيمة الإنتاج والجودة، لا نزال بعيدين عن استخدام هذا في الأفلام. لديهم أفضل الحوسبة، لكنهم ما زالوا لا يملكون ما يكفي لخدمة عدد كبير من المستخدمين. لا يزال هناك عنصر كبير في هذا كونها مثل ماكينة القمار حيث تطلب شيئًا ما، وتقوم بخلط الأفكار معًا، ولا تحتوي على محرك فيزيائي حقيقي لها. إنها مجرد مرآة تعكس ما تراه. هناك طريق طويل لنقطعه لتحقيق اتساق الشخصية. ربما بعد 10 سنوات من الآن، يمكن أن يحدث فرقًا حقيقيًا في حياة شخص ما ليس لديه أي موارد. لكن الناس سيجدون أن تجربة استخدام هذا ليست مثيرة مثل تجربة التواجد في موقع التصوير مع أشخاص حقيقيين. ما يجعل صناعة الأفلام مجالًا فريدًا هو الجانب التعاوني منه والذي لا يمكن إنشاؤه في تجربة معزولة، بالتحدث إلى الآلة.
سورا يمكن أن يقلل من تكلفة صناعة الأفلام
أنا متحمس لحالات الاستخدام الأكثر تجريبية لها، ولكن هناك بالتأكيد عنصر توفير المال. الأفلام باهظة الثمن بشكل لا يصدق. كما أنها مسرفة وغير فعالة بشكل لا يصدق. لذلك لا أعتقد أنه أمر سيئ محاولة جعل العملية أكثر كفاءة. ربما هذا هو الجانب الذي يفتقده الناس بعد الإضرابات. لقد كانت الاستوديوهات صارخة جدًا بشأن قيامها بإعطاء الضوء الأخضر لمشاريع أقل الآن لأنه يتعين عليها وضع المزيد من الكتاب في غرفة الكتاب. وعليهم أن يدفعوا المزيد على المخلفات. إذا كان هذا يمكن أن يخلق قنوات لتصنيع الأشياء التي لم تكن مضاءة باللون الأخضر وأننا نستطيع بالفعل البدء في إنتاج المزيد، فأنا لا أرى ذلك كأمر سيئ حقًا.
أعتقد أن مرحلة ما بعد الإنتاج هي بالتأكيد أكثر عرضة للتغيير. الكثير من الأفلام المستقلة لا تتمتع برفاهية الحصول على أي شيء لمرحلة ما بعد الإنتاج. إذا كان هذا يمكن أن يوفر مجالًا للأفلام المستقلة لتحلم بشكل أكبر قليلاً، وتطلق النار على مستوى أعلى قليلاً، فهذا شيء جيد في النهاية.
Sora لديه الريادة الآن، ولكن في النهاية ستكون هناك نسخة مفتوحة المصدر من هذا والتي لن يتم تصنيعها بواسطة OpenAI. من المحتمل أن يلحق الانتشار المستقر بالركب في مرحلة ما. يمكنني أن أرى أنها تحل محل جوانب اللقطات B-roll والإدراج على وجه التحديد، أو اللقطات الصغيرة، أو أي لقطات مخزنة. كمخرج، تريد قضاء الكثير من الوقت في العمل مع الممثلين. لا ترغب في قضاء وقتك في إدراج اللقطات التي لا تمثل أهمية كبيرة للقصة. كما أن اللقطات المخزنة محدودة بشكل لا يصدق ولا تتطابق دائمًا من الناحية الجمالية.
سورا لا يزال مشروع بحث في مرحلة ألفا
ليس لدى OpenAI جدول زمني لذلك. إنه أمر مربك بعض الشيء من هو السوق لهذا الغرض. آمل ألا يغفلوا الأمر لأن الأداة أكثر تعقيدًا مما أعتقد أن الناس يدركونه، لكنها تحتاج إلى جدال، وأعتقد أنه سيكون من العار أن نجعل هذا نوعًا من آلة إنشاء المحتوى لمرة واحدة . آمل أن يسير هذا في اتجاه الطريق الأكثر تطوراً. قد يكون هناك المزيد من الأموال في هوليوود، ولكن سيكون هناك الكثير مما سيتعين عليهم القيام به من أجل خدمة هذه الفئة الراقية حقًا.
أحاول أن أضع الخط الفاصل بين اللعب بالتكنولوجيا السحرية التي لا يمكن أن تحدث إلا بسبب شركات التكنولوجيا هذه وطمأنة صانعي الأفلام بأن هذا هو الوقت المناسب حقًا لأن تكون صانع أفلام بسبب القدرة على تصور أفكارك التي لم نتمكن منها أبدًا للقيام به من قبل. ولهذا السبب أتحدث مع كل هذه الشركات: للتأكد من أنهم يعرفون الجهة التي تصنع لهم هذه الأدوات. أنا قلق بشأن الإفراط في استخدام الذكاء الاصطناعي وما سيفعله لنا من حيث المهارات والإبداع والثقافة حتى نتمكن من إضعاف أنفسنا. وأعتقد أن هذا هو الاستخدام الأكثر مللاً للذكاء الاصطناعي.
إليك المطالبة الكاملة لـ “السجل الذهبي” (تمت إضافة فواصل الفقرات):
لقطة فيلم تمثيلي متقلبة المزاج، نقوم بتكبير المشهد النيزكي الصخري المتقلب للأرض الخام مع سجل ذهبي يرتفع عبر أعماق الفضاء المظلمة، والصخور السريالية العائمة، والدخان يملأ الهواء. المشهد فوضوي وبدائي، مع إطلاق العنان للقوة التدميرية للطبيعة.
يتم التقاط المشهد من منظور تكبير سريع، كما لو أن المشاهد يطير في الهواء ويراقب المشهد من الأعلى. ضوء الشمس الطبيعي الناعم، تكون اللقطة ضبابية ومشوهة، مع مخزون حبيبات فيلم فوجي مقاس 35 مم. التناظرية. ضبابية الحركة والملمس السينمائي، الضوء العضوي المتقلب من الشمس في الفضاء، ناسا، عدسة بصرية مشوهة، نغمة عتيقة، نسيج حبيبي للفيلم.
لقطة فيلم تناظرية، نقوم بتكبير الحركة وطمس انتقال المشهد من المناظر الطبيعية الصخرية إلى سجل ذهبي متعرج يطير في الهواء في فراغ صخري يبدأ جسده في الذوبان. يمكن للمشاهد رؤية حركة ضبابية بينما يندفع الرجل الذائب إلى الماضي، ويتم التقاط المشهد من منظور تكبير سريع، ويتم لقطة فيلم تناظرية نقوم بتكبيرها بالحركة، ويخرج المشاهد من السجل الذهبي للحاجز ويدخل في حقل من الصخور العائمة. المشهد مليء بالصخور السريالية العائمة والطائرة.
يسقط السجل الذهبي في مكانه ويتقلب ويدور في ظلام الفضاء، وينتقل المشهد من حقل الصخور العائمة إلى اليد المفتوحة المصنوعة من شظايا الذهب التي تنتمي إلى سديم سائل شفاف قنديل البحر قزحي الألوان، إله غريب مع محلاق ينتشر عبر الفضاء، يذوب الذهب في شكل دائري، يتقلب السجل الدائري الذهبي ويطير ويدور في الهواء، ويمكن للمشاهد رؤية السجل الذهبي مفتوحًا، كما لو أنه يقوم بالتكبير عبر اليد الكريستالية ويراقب المشهد من الأسفل.
ينتقل المشهد عبر مساحة شاسعة من السجل الذهبي يتقلب ويطير بشكل ديناميكي، وندور حولنا لمتابعة الحدث حيث يتفاعل شكل كائن فضائي من قنديل البحر الشفاف مع السجل الذهبي، وتغمره الأنهار القزحية مع سجل ذهبي يرتفع من خلال انفجار الغبار والدخان الصاروخي. ويمكن للمشاهد رؤية المدينة من زاوية عالية، وكأنه يحلق فوق الشوارع ويراقب المشهد من الأعلى.
نطير إلى زاوية منخفضة من النهر قزحي الألوان، وكانت اللقطة ضبابية ومشوهة، مع تأثير حبيبي لفيلم مقاس 35 مم. طمس الحركة والملمس السينمائي. ينتقل المشهد ويظهر على جانب السجل الذهبي الذي يطير في الهواء، والأعضاء العضوية الحيوية، والسديم الشفاف، وقنديل البحر قزحي الألوان، إله غريب مع محلاق ينتشر عبر الفضاء، وذوبان السجل الذهبي المصنوع من سجل ذهبي قزحي الألوان يطير في الفضاء الخارجي، إلى مسافة بعيدة. . اللقطة واضحة ونقية