بينما تتسابق صناعة التكنولوجيا لبناء نماذج تعلم اللغة للذكاء الاصطناعي، تركز الباحثة أنيما أناندكومار على كيفية قدرة الذكاء الاصطناعي على محاكاة العالم المادي، من التنبؤ بأنماط المناخ إلى إعادة تصميم البروتينات في الطب.

أمضت المديرة السابقة لأبحاث الذكاء الاصطناعي في شركة إنفيديا وخريجة خدمات الويب من أمازون عقودًا من الزمن تعمل في طليعة خوارزميات الذكاء الاصطناعي وساعدت في جعل محاكي الطقس FourCastNet من إنفيديا متاحًا كمصدر مفتوح. عملت كأستاذة برين في قسم علوم الكمبيوتر والرياضيات في معهد كاليفورنيا للتكنولوجيا منذ عام 2017 وتشرف على جهود الجامعة في مجال أبحاث التعلم الآلي. على وجه التحديد، تركز على الموتر، وهي دالة متعددة الخطوط يمكن أن تساعد في حل المشكلات ذات الدرجة الأعلى في الذكاء الاصطناعي، مثل نمذجة السوائل.

إن الذكاء الاصطناعي له حدود فيما يتعلق بما يمكنه تعلمه. فإذا سألت تطبيق ChatGPT عن الطقس، فسوف يجمع إجابة من تطبيقات الطقس الموجودة على الويب. ومن ناحية أخرى، يبحث أناندكومار عن كيفية تمكن الذكاء الاصطناعي من محاكاة الطقس بشكل أكثر دقة والمساعدة في تقديم تنبؤات بشأن أزمة المناخ بعد عقد من الزمان.

في محادثة مع Business Insider، تحدثت أناندكومار عن أبحاثها الأكاديمية باستخدام المشغلات العصبية، وهي شبكة تربط بين وظائف الذكاء الاصطناعي المختلفة ويمكن استخدامها لنمذجة العمليات الفيزيائية. كما أوضحت لماذا من المهم وجود ثقافة مفتوحة المصدر للذكاء الاصطناعي في شركات التكنولوجيا الكبرى.

تم تحرير ما يلي من أجل الطول والوضوح.

BI: لقد مررت بسلسلة من التجارب في الصناعة والمجال الأكاديمي طوال معظم حياتك المهنية. لماذا قررت مؤخرًا ترك Nvidia للعمل الأكاديمي بدوام كامل بينما يتجه الكثير من الأشخاص إلى الاتجاه الآخر؟

على مدى العقد الماضي أو نحو ذلك، كان لي قدم في الصناعة والأوساط الأكاديمية. أرى أن ذلك هو العصر الذهبي للبحث المفتوح حيث يمكنك حتى في الصناعة أن تكون مفتوح المصدر، وأن تنشر، وأن تتعاون بحرية. لسوء الحظ، منذ ظهور ChatGPT، تغير الكثير من ذلك لأن هناك الكثير من الدفع نحو البحث المغلق والنماذج المغلقة في العديد من شركات التكنولوجيا الكبرى. حتى عندما تصبح النماذج مفتوحة المصدر، لا يتم عرض الكثير من التفاصيل للجمهور، وبالتالي هناك بالتأكيد جدران حماية كبيرة تحدث. بالنسبة لي، كان هدفي من الحصول على موعد مزدوج هو تمكين البحث المفتوح حقًا والقيام بذلك للمهام المفيدة. لقد بنينا أول نموذج للطقس قائم على الذكاء الاصطناعي. لقد بنينا نماذج لاكتشاف الأدوية ونقوم بتصميم الأجهزة الطبية. كل هذا يتطلب بعض الانفتاح بمجرد افتقاره، شعرت أن هدفي الحقيقي هو تعزيز التأثير والاستفادة من العلوم الإنسانية. وبقدر ما يبدو الأمر مبتذلاً، شعرت أن هذه طريقة أفضل للقيام بذلك. الفكرة هي أن هناك الكثير من الإنفاق الحسابي لتدريب النماذج الكبيرة والجانب المتعلق بكيفية تحقيق الربح من ذلك. لا أعتقد أن هذا هدف خاطئ؛ فهو لا يتماشى مع الطريقة التي شعرت بها أنه يمكن تحقيق أفضل تأثير.

BI: ما هو الوضع اليومي لإجراء الأبحاث لصالح الصناعة مقارنة بالوضع الحالي مع معهد كاليفورنيا للتكنولوجيا؟

من المؤكد أن الموارد أقل بكثير. في كل من AWS وNvidia، كان لدينا قدر كبير من الحرية لمتابعة مجالات بحثية جديدة. الموارد الحاسوبية ليست قريبة بأي حال من الأحوال مما تمتلكه شركات التكنولوجيا الكبرى. بالنسبة لي، الضرورة هي أم الاختراع. إذن كيف نبني أطرًا وخوارزميات يمكنها القيام بالمزيد بأقل؟ أعتقد أن هناك الكثير من الأبحاث المثيرة للاهتمام التي ستخرج من الأوساط الأكاديمية في السنوات القليلة القادمة لأن هذه هي الطريقة الوحيدة التي يمكننا من خلالها مواكبة الابتكار في الأوساط الأكاديمية التي لن تتبع نفس النهج الذي تتبعه شركات التكنولوجيا الكبرى، بل ستفكر حقًا في كيفية جعل الخوارزميات أكثر كفاءة.

س: ما هي الخوارزميات الأفضل والأكثر “كفاءة”، وما هي تأثيراتها الأوسع؟

يمكن أن تأتي الخوارزميات الذكية بعدة طرق. أحدها هو أن تكون ذكيًا بشأن كيفية جعل هذه الخوارزميات فعالة، وليس مجرد الحصول على أجهزة أفضل.

الجانب الآخر هو تقليل الذاكرة أثناء التدريب من خلال القيام بخوارزميات تحسين أكثر ذكاءً. يمكنك تقليل كمية الذاكرة المطلوبة بشكل كبير حتى تتمكن من وضع نماذج كبيرة إلى حد ما على وحدات معالجة رسومية أصغر حجمًا أو وحدات معالجة رسومية ذات ذاكرة أقل وأرخص. في بعض الأحيان، تحتاج إلى العودة إلى المبادئ الأولى والسؤال، هل هناك بعض الطرق الأساسية لإعادة التفكير تمامًا في كيفية القيام بذلك؟

BI: في الخاص بك محاضرة TEDتقول إن نماذج اللغة تعاني من الهلوسة، وليس لها أساس مادي. هل يرتبط هذا بأي مفاهيم خاطئة لدى الناس حول الذكاء الاصطناعي؟

لا يشفر النص كل المعرفة في العالم. إنها المعرفة التي جمعها البشر، لكنها ليست معرفة العالم المادي. يمكنك أن تمتلك كل أنواع النظريات حول لعب التنس بشكل جيد، لكن نموذج اللغة بحد ذاته لا يمكنه تنفيذ فعل لعب التنس. وبالمثل، بالنسبة للتنبؤ بالطقس، يمكنك أن تسأل ChatGPT عن الطقس غدًا، ويمكنه أن يأتي بإجابة، لكنه سيفعل ذلك من خلال البحث في تطبيق الطقس. ليس لديه داخليًا القدرة على محاكاة ما يحدث للطقس. إنه لا يفهم داخليًا ما هو الإعصار. يمكنه البحث عن بعض المعلومات النصية، لكنه لا يستطيع الذهاب ومحاكاة العملية المادية. نفس الشيء مع تصميم جناح طائرة أفضل أو صاروخ أفضل. يمكنك أن تسأل أيًا من مولدات الصور، وقد يعطونك الصاروخ الأكثر روعة، لكنني على الأرجح لن أكون قادرًا على الطيران في العالم الحقيقي لأن هذه التصاميم لا تستند إلى الفيزياء.

BI: تتحدث كثيرًا عن المشغلات العصبية. ما هي، وكيف يتم استخدامها الآن في الحياة اليومية لصناعة التكنولوجيا أو الصناعات الأخرى؟

فكر في الأمر باعتباره توسيعًا لنموذج التعلم العميق ليشمل هذه الأشياء المستمرة: حقيقة أن الأرض ليست مجرد مجموعة ثابتة من وحدات البكسل، بل إنها في الواقع هذه المساحة المستمرة. يمكنك الذهاب والتكبير بأي دقة والحصول على إجابات بكل هذه الدقة. هكذا يعمل العالم المادي بأكمله. إذا فكرت حقًا في العالم، فسوف تجد أنه يحدث بمقاييس مختلفة للغاية. فكر حتى في التأثيرات الكمومية اللازمة لتصميم الأدوية والعديد من المشكلات العملية المهمة للغاية. في حين نحتاج حقًا إلى امتلاك هذه القدرة على نمذجة الطقس والمناخ، نحتاج أيضًا إلى نمذجة كيفية تفاعل هذه الجسيمات الصغيرة في السحابة مع بعضها البعض. كيف تتحرك هذه الدوامات؟ مع الذكاء الاصطناعي القياسي، يمكنك القيام بذلك من أعلى إلى أسفل. في حالة الطقس، هناك الكثير من المعلومات التاريخية، لكنك قد تكون أعمى للغاية. ما نفعله مع المشغلات العصبية هو الجمع حقًا بين النموذجين اللذين يمكنك تعلمهما بالبيانات، بالإضافة إلى إضافة أي من المعرفة الفيزيائية التي لديك، والقيام بذلك بدقة متعددة حتى تتمكن من نمذجة هذه الظواهر الفيزيائية بدقة شديدة.

لقد كان البحث العلمي والتصميم الهندسي في الماضي يعتمدان على التجربة والخطأ. فقد يأتي شخص تعرفه بفكرة ما، ولكن يتعين عليك أن تذهب لاختبارها في المختبر، وقد تكون التجارب المعملية شاقة للغاية وطويلة، وليس في كل الأوقات.

إن المشغلات العصبية مع إطار عمل الذكاء الاصطناعي تشكل تغييرًا جذريًا لأنه من خلال هذا، يمكنك إنشاء توأم رقمي عالي الدقة. لذا بدلاً من الذهاب إلى المختبر والاختبار فعليًا، لديك الآن توأم رقمي ينمذج بدقة شديدة ظواهر معقدة للغاية مثل ديناميكيات السوائل. ومع ذلك، فإن القدرة على ذلك هي في الواقع تحسين التصميم. لذا لا تستخدم هذا التوأم الرقمي فقط لتجربة إمكانيات مختلفة، بل اطلب منه أيضًا إنشاء أفضل تصميم.

BI: ما هي بعض الأشياء التي يجب أن نركز عليها عندما يتعلق الأمر بنشر الديمقراطية في مجال الذكاء الاصطناعي؟

عندما أتحدث عن الديمقراطية، يمكن أن يكون ذلك من حيث إتاحة نماذج مثل Llama بشكل مفتوح، ولكن أيضًا معرفة كيفية تدريب النماذج هي شيء نحتاجه بشكل أكثر علنية حتى نتمكن من اختبار التقنيات بعناية وتطويرها بشكل أكبر لأن هناك الكثير من التحديات الكبيرة عندما يتعلق الأمر باللغة وجميع فئات النماذج الأخرى أيضًا. وهنا، كما تعلمون، نريد أن نكون حذرين للغاية في عدم وضع لوائح تضر بالمصدر المفتوح واللاعبين الصغار.

لقد قمت مؤخرًا بقيادة رسالة من معهد كاليفورنيا للتكنولوجيا لوقف مشروع قانون SB-1047. (ملاحظة: تم تمرير مشروع قانون SB-1047 في الهيئة التشريعية لولاية كاليفورنيا يوم الأربعاء وسيتم إرساله إلى الحاكم جافين نيوسوم للنظر النهائي فيه. لقد أدلى العديد من الأكاديميين الآخرين بتصريحات، كما خرج أشخاص من الصناعة ضد هذا القانون. وحتى لو كانت هناك نوايا حسنة، فمن المهم أن نكون حذرين من أن تكون هناك عواقب غير مقصودة. هناك فكرة الاستيلاء التنظيمي، حيث لا تزال الشركات الكبرى قادرة على التعامل مع التنظيم من خلال توظيف الكثير من الناس. وعندما يتعلق الأمر بالشركات الناشئة، فإنها في وضع سيء للغاية. إذا كنت تطلب من مطوري المصدر المفتوح الكثير من الأسئلة فيما يتعلق بما إذا كان هناك أي استخدام ضار في مجرى النهر وأنهم سيكونون مسؤولين، فإن المصدر المفتوح يُقتل فعليًا. وهذا ليس جيدًا للأوساط الأكاديمية أيضًا. لطالما كانت الذكاء الاصطناعي ثورة مفتوحة المصدر منذ أيامها الأولى لأن الناس أنشأوا مجموعات البيانات هذه وعقدوا المسابقات، وشارك الجميع، وأجروا الأبحاث، وتحدثوا عنها، وشاركوا الكود. بهذه الطريقة حقق المجتمع هذه التطورات المذهلة في مثل هذا الوقت القصير. أعتقد أن الطريقة الصحيحة للقيام بذلك ليست التفكير في تنظيم الذكاء الاصطناعي، بل تنظيم التأثيرات الضارة بغض النظر عما تم استخدامه.