ليس من غير المألوف أن تخشى شركات الذكاء الاصطناعى من أن نفيديا ستنقل وجعل عملها زائداً. ولكن عندما حدث ذلك لـ Tuhin Srivastava ، كان هادئًا تمامًا.
وقال سيرفاستافا ، مؤسس منصة الاستدلال منظمة العفو الدولية ، لشركة Business Insider: “هذا هو الشيء الذي يتعلق بمنظمة العفو الدولية – يجب أن تحرق القوارب”. لم يحرقه بعد ، لكنه اشترى الكيروسين.
تعود القصة إلى عندما أخذ ديبسيك عالم الذكاء الاصطناعى العاصفة في بداية هذا العام. كان Srivastava وفريقه يعملون مع النموذج لأسابيع ، لكنه كان صراعًا.
كانت المشكلة عبارة عملية الحوسبة التي تحدث عندما تنشئ الذكاء الاصطناعى المخرجات ، يجب أن يتم تحجيمها لتشغيل هذه النماذج الكبيرة والمعقدة بسرعة.
كانت العناصر المتعددة تصل إلى اختناقات وبطء تسليم الاستجابات النموذجية ، مما يجعلها أقل فائدة لعملاء باستين ، الذين كانوا يطالبون بالوصول إلى النموذج.
تتمتع شركة Srivastava بإمكانية الوصول إلى رقائق H200 من NVIDIA – وهي أفضل شريحة متوفرة على نطاق واسع يمكنها التعامل مع النموذج المتقدم في ذلك الوقت – لكن منصة الاستدلال في NVIDIA كانت تلبيس.
وقال Srivastava إن مكدس البرامج الذي يسمى Triton Interference Server كان يتعثر مع كل الاستدلال المطلوب لنموذج التفكير في Deepseek R1. لذا بنى باستين خاصتهم ، والذي لا يزالون يستخدمونه الآن.
بعد ذلك ، في مارس ، انتقل جنسن هوانغ إلى المسرح في مؤتمر GTC الضخم للشركة وأطلق منصة استدلال جديدة: Dynamo.
Dynamo عبارة عن برنامج مفتوح المصدر يساعد رقائق Nvidia على التعامل مع الاستدلال المكثف المستخدم في نماذج التفكير على نطاق واسع.
وقال هوانغ على خشبة المسرح “إنه نظام التشغيل في مصنع منظمة العفو الدولية في الأساس”.
“كان هذا هو المكان الذي كان فيه عفريت” ، قال سريفاستافا. ولم يكن وصول نفيديا مفاجأة. وقال سيرفاستافا إنه عندما يتجاوز الطاغوت منصة ما يعادل باستين ، سيتخلى الفريق الصغير عن ما بنوه وتبديله.
إنه يتوقع أن يستغرق الأمر بضعة أشهر كحد أقصى.
“حرق القوارب.”
إنها ليست فقط أدوات صنع Nvidia مع فريقها الضخم وميزانية البحث والتطوير لتتناسب. التعلم الآلي يتطور باستمرار. تصبح النماذج أكثر تعقيدًا وتتطلب المزيد من قوة الحوسبة والعبقرية الهندسية للعمل على نطاق واسع ، ثم تتقلص مرة أخرى عندما يجد هؤلاء المهندسون كفاءات جديدة وتغييرات الرياضيات. يتوازن الباحثون والمطورين في موازنة التكلفة والوقت والدقة والمدخلات للأجهزة ، وكل تغيير يعيد تغيير سطح السفينة.
وقال كارل موزوركويتش ، المهندس المعماري الرئيسي في شركة سحابة فالدي: “لا يمكنك الزواج من إطار معين أو طريقة لفعل الأشياء”.
وقال ثيو براون ، وهو مطور ومطوره ، شركته ، بينغ ، برامج منظمة العفو الدولية للمطورين الآخرين: “هذا هو الشيء المفضل لدي في الذكاء الاصطناعي”. وقال لـ BI: “إنه يجعل هذه الأشياء التي تعاملها الصناعة تاريخياً على أنها ذات قيمة فائقة وقدوسية ، ويجعلها رخيصة للغاية وسهلة التخلص منها”.
أمضى براون السنوات الأولى من ترميز حياته المهنية للشركات الكبرى مثل Twitch. عندما رأى سببًا للبدء من جديد في مشروع ترميز بدلاً من البناء فوقه ، واجه مقاومة ، حتى عندما يوفر الوقت أو المال. غرقت التكلفة سداد.
وقال براون: “كان علي أن أتعلم أنه بدلاً من انتظارهم ليقولوا ،” لا ، افعل ذلك بسرعة كبيرة ليس لديهم الوقت لمنعك “.
هذه هي عقلية العديد من بناة حافة النزيف في الذكاء الاصطناعي.
غالبًا ما يميز الشركات الناشئة عن الشركات الكبيرة.
يشرح Quinn Slack ، الرئيس التنفيذي لمنصة ترميز AI ، في كثير من الأحيان ، هذا لعملائه عندما يلتقي بشركات Fortune 500 التي ربما تكون قد بنيت أول جولة من الذكاء الاصطناعي على الأسس المهزوزة.
وقال “أود أن أقول إن 80 ٪ منهم يصلون إلى هناك في اجتماع لمدة ساعة”.
الأرض الأكثر ثباتًا ترتفع المكدس
يقوم Ben Miller ، الرئيس التنفيذي لجمع التبرعات للاستثمار العقاري ، ببناء منتج منظمة العفو الدولية لهذه الصناعة ، وهو لا يقلق كثيرًا بشأن أحدث طراز. إذا كان النموذج يعمل لغرضه ، فهو يعمل ، والانتقال إلى أحدث الابتكار من غير المرجح أن يستحق ساعات المهندس.
وقال “أنا متمسك بما يعمل بشكل جيد بما يكفي لأطول فترة ممكنة”. هذا جزئيًا لأن Miller لديه منظمة كبيرة ، ولكن هذا أيضًا لأنه يبني الأشياء بعيدًا عن المكدس.
يتكون هذا المكدس من الأجهزة في الأسفل ، وعادة ما يكون وحدات معالجة الرسومات في Nvidia ، ثم طبقات على طبقات من البرامج. باستين هو بضع طبقات من Nvidia. نماذج الذكاء الاصطناعى ، مثل R1 و GPT-4O ، هي بعض الطبقات من Baseten. و Miller هو فقط في الجزء العلوي حيث المستهلكين.
وقال موزوركيويتش: “ليس هناك ما يضمن أنك ستزرع قاعدة عملائك أو إيراداتك لمجرد أنك تطلق أحدث ميزة حافة النزيف”.
“عندما تكون أمام المستخدم النهائي ، هناك عوائد متناقصة للتحرك بسرعة وكسر الأشياء.”
هل لديك نصيحة؟ اتصل بهذا المراسل عبر البريد الإلكتروني على ecosgrove@businessinsider.com أو إشارة في 443-333-9088. استخدم عنوان بريد إلكتروني شخصي وجهاز غير عمل ؛ إليك دليلنا لمشاركة المعلومات بشكل آمن.