من الصعب أن تخسر تقدماً كبيراً يبلغ تريليونات الدولارات، ولكن هذا هو ما يحاول منافسو إنفيديا تحقيقه. وربما تكون لديهم أفضل فرصة للتنافس في نوع من الحوسبة القائمة على الذكاء الاصطناعي يسمى الاستدلال.

الاستدلال هو مرحلة إنتاج الحوسبة الذكاء الاصطناعي. بمجرد الانتهاء من تدريب النموذج، تقوم شرائح الاستدلال بإنتاج المخرجات وإكمال المهام بناءً على هذا التدريب – سواء كان ذلك من خلال إنشاء صورة أو إجابات مكتوبة على مطالبة.

شارك رودريجو ليانج في تأسيس شركة SambaNova Systems في عام 2017 بهدف ملاحقة شركة Nvidia التي كانت بالفعل رائدة في هذا المجال. ولكن في ذلك الوقت، كانت منظومة الذكاء الاصطناعي أصغر سنًا، وكانت أحمال الاستدلال ضئيلة. ومع تقدم النماذج الأساسية في الحجم والدقة، أصبح التحول من تدريب نماذج التعلم الآلي إلى استخدامها واضحًا.

في الشهر الماضي، قالت كولين كريس، المديرة المالية لشركة إنفيديا، إن أحمال عمل مركز البيانات الخاص بالشركة وصلت إلى 40% من الاستدلال. وقال ليانج لـ Business Insider إنه يتوقع أن تصل أحمال عمل الحوسبة بالذكاء الاصطناعي إلى 90%. سيتم الاستدلال على ذلك في المستقبل غير البعيد.

وهذا هو السبب وراء قيام العديد من الشركات الناشئة بدخول سوق الاستدلال بشكل مكثف – مما يؤكد على المجالات التي قد تتفوق فيها على الشركات العملاقة في هذا المجال.

تستخدم SambaNova وحدة تدفق بيانات قابلة لإعادة التكوين أو RDU بدلاً من وحدات معالجة الرسومات الخاصة بشركتي Nvidia وAMD. تزعم شركة Liang أن بنيتها مناسبة بشكل أفضل لنماذج التعلم الآلي لأنها مصممة لهذا الغرض، وليس لعرض الرسومات. وهي حجة يشير إليها أيضًا الرئيس التنفيذي لشركة Cerebras، أندرو فيلدمان، منافس Nvidia.

وتتفق شركة Nvidia أيضًا على أن الاستدلال هو السوق الأكبر، وفقًا لمحللي بيرنشتاين الذين التقوا مع المديرة المالية لشركة Nvidia كوليت كريس الأسبوع الماضي.

يعتقد كريس أن “عرض إنفيديا هو الأفضل للاستدلال نظرًا لقوة شبكاتها، وعرض التبريد السائل، ووحدة المعالجة المركزية ARM، وكلها ضرورية للاستدلال الأمثل”، كما كتب المحللون. كما لاحظ كريس أن معظم إيرادات الاستدلال لدى إنفيديا تأتي حاليًا من محركات التوصية والبحث. ورفضت إنفيديا التعليق على هذا التقرير.

وقال ليانغ إن سوق الاستدلال سوف يبدأ في النضج خلال ستة أشهر تقريبا.

الشركات الناشئة تراهن على سرعة الحوسبة

ولإبعاد العملاء عن إنفيديا، تروج شركات جديدة مثل جروك وسيريبراس وسامبا نوفا لسرعتها. والواقع أن سيريبراس وسامبا نوفا تزعمان أنهما تقدمان أسرع عملية حوسبة استدلالية في العالم. ولا تستخدم أي منهما وحدات معالجة الرسوميات، وهو النوع من الرقائق التي تروج لها إنفيديا وأيه إم دي.

وفقًا لشركة SambaNova، فإن وحدات RDU الخاصة بها مثالية للذكاء الاصطناعي الوكيل، الذي يمكنه إكمال الوظائف دون الكثير من التعليمات. السرعة هي عامل مهم عندما تتحدث نماذج الذكاء الاصطناعي المتعددة مع بعضها البعض، والانتظار للحصول على إجابة يمكن أن يخفف من سحر الذكاء الاصطناعي التوليدي.

ولكن لا يوجد مقياس واحد لسرعة الاستدلال. تحدد مواصفات كل نموذج، مثل Llama من Meta، أو Claude من Anthropic، أو o1 من OpenAI، مدى سرعة توليد النتائج.

تنتج السرعة في الحوسبة القائمة على الذكاء الاصطناعي عن عدة عوامل هندسية تتجاوز الشريحة نفسها. والطريقة التي يتم بها ربط الشرائح ببعضها البعض يمكن أن تؤثر على أدائها، مما يعني أن شرائح Nvidia في مركز بيانات واحد قد تعمل بشكل مختلف عن نفس الشريحة في مركز بيانات آخر.

عدد الرموز في الثانية التي يمكن استهلاكها (عند ظهور مطالبة) وتوليدها (عند ظهور استجابة) هو مقياس شائع لسرعة الحوسبة بالذكاء الاصطناعي. الرموز هي الأساس وحدة البيانات، حيث يمكن أن تكون البيانات عبارة عن وحدات بكسل وكلمات ومقاطع صوتية وما إلى ذلك. لكن الرموز في الثانية لا تأخذ في الاعتبار زمن الوصول أو التأخير – والذي يمكن أن ينبع من عوامل متعددة.

من الصعب أيضًا إجراء مقارنة بين الأجهزة من حيث الأداء يعتمد ذلك على كيفية إعداد الأجهزة والبرنامج الذي يقوم بتشغيلها. وبالإضافة إلى ذلك، فإن النماذج نفسها تتحسن باستمرار.

على أمل تطوير سوق الاستدلال بشكل أسرع، وشق طريقهم إلى سوق تهيمن عليه شركة إنفيديا، تحاول العديد من شركات الأجهزة الجديدة نماذج أعمال مختلفة لتجاوز المنافسة المباشرة مع إنفيديا والانتقال مباشرة إلى الشركات التي تعمل على بناء الذكاء الاصطناعي.

تقدم شركة SambaNova نموذج Llama الأساسي مفتوح المصدر من Meta من خلال خدمتها السحابية، كما أطلقت Cerebras وGroq خدمات مماثلة. وبالتالي، تتنافس هذه الشركات مع شركات تصميم الرقائق مثل Nvidia وشركات نموذج الأساس للذكاء الاصطناعي مثل OpenAI.

يوفر Artificialanalysis.ai معلومات عامة تقارن النماذج التي عرض الاستدلال كخدمة عبر واجهة برمجة التطبيقات. في يوم الأربعاء، أظهر الموقع أن Cerebras وSambaNova وGroq كانت بالفعل أسرع ثلاث واجهات برمجة تطبيقات لنماذج Llama 3.1 70B و8B من Met'a.

لم يتم تضمين Nvidia في هذه المقارنة لأن الشركة لا تقدم خدمة الاستدلال كخدمة. تشارك MLPerf معايير أداء الاستدلال لسرعة الحوسبة بالأجهزة. تعد Nvidia من بين أفضل الشركات أداءً في هذه المجموعة من البيانات، لكن منافسيها من الشركات الناشئة لم يتم تضمينهم.

وقال ليانج “أعتقد أنك سترى لعبة الاستدلال هذه مفتوحة أمام كل هذه البدائل الأخرى بطريقة أوسع بكثير من سوق ما قبل التدريب”. وتابع: “نظرًا لأنها كانت مركزة للغاية مع عدد قليل جدًا من اللاعبين، فقد كان جينسن قادرًا على التفاوض شخصيًا على هذه الصفقات بطريقة يصعب على الشركات الناشئة تفكيكها”.

ما هي المشكلة؟

قال ديلان باتيل، كبير المحللين في شركة Semianalysis، إن مشتري الرقائق الإلكترونية يجب أن يأخذوا في الاعتبار ليس فقط الأداء، بل وأيضاً كافة المزايا والنفقات التي تحدث فرقاً على مدار عمر الرقاقة. ومن وجهة نظره، قد تبدأ هذه الرقائق الإلكترونية الناشئة في إظهار بعض الشقوق.

وقال باتيل لـ BI أن “وحدات معالجة الرسومات توفر تكلفة إجمالية أعلى للملكية لكل رمز”.

لا يتفق كل من سامبانوفا وسيريبراس مع هذا الرأي.

وقال ليانغ “عادة ما يكون هناك تنازل عندما يتعلق الأمر بالسرعة والتكلفة. يمكن أن تعني سرعة الاستدلال الأعلى بصمة أجهزة أكبر، مما يتطلب بدوره تكاليف أعلى”، مضيفًا أن SambaNova تعوض عن هذه التنازلات من خلال توفير السرعة والسعة باستخدام عدد أقل من الرقائق، وبالتالي انخفاض التكاليف.

وقد اعترض أندرو فيلدمان، الرئيس التنفيذي لشركة Cerebras، على الرأي القائل بأن وحدات معالجة الرسوميات تتمتع بتكلفة إجمالية أقل للملكية، قائلاً: “بينما قد يزعم مصنعو وحدات معالجة الرسوميات الريادة في إجمالي تكلفة الملكية، فإن هذا ليس وظيفة التكنولوجيا بل هو البوق الكبير الذي لديهم”.

هل لديك نصيحة أو فكرة لتشاركها؟ اتصل بالمراسلة الرئيسية إيما كوسجروف على إيكوسجروف@businessinsider.com أو استخدم تطبيق المراسلة الآمن Signal: 443-333-9088