قضى الرؤساء التنفيذيون للتكنولوجيا الذين لديهم خطط كبيرة للذكاء الاصطناعي الكثير من الوقت في البحث عن شرائح Nvidia في العام الماضي.
أصبحت رقائق شركة سانتا كلارا العملاقة، والمعروفة باسم وحدات معالجة الرسوميات (GPUs)، هي الخاصية الأكثر سخونة لطفرة الذكاء الاصطناعي التوليدية. تسابقت شخصيات قوية مثل مارك زوكربيرج وسام ألتمان لتأمين الإمدادات من موارد الحوسبة الحيوية اللازمة لتشغيل تطبيقات مثل ChatGPT.
ومع ذلك، هناك رئيسة واحدة للذكاء الاصطناعي لم تضع نفسها تحت رحمة زعيم ملياردير Nvidia Jensen Huang، وإمبراطوريته GPU التي تبلغ قيمتها 2.2 تريليون دولار. تعرف على شارون تشو.
كان الشاب البالغ من العمر 30 عامًا يتمتع بمهنة رائعة.
إنها أول شخص يتخصص في كل من الكلاسيكيات وعلوم الكمبيوتر في جامعة هارفارد. حصلت على درجة الدكتوراه. حصل على درجة الدكتوراه في الذكاء الاصطناعي في جامعة ستانفورد تحت قيادة رائد التعلم الآلي أندرو إنج، وأصبح أستاذًا مساعدًا في الجامعة، وخصص وقتًا للتدريس عبر الإنترنت والاستثمار الملائكي. إذا لم يكن ذلك كافيًا، فقد طُلب منها أيضًا أن تكون ضمن الفريق المؤسس المبكر لشركة Anthropic، منافس OpenAI الذي جمع للتو 2.75 مليار دولار إضافية من أمازون.
ومع ذلك، فقد أخذتها طموحاتها في اتجاه مختلف قليلاً، حيث إنها الآن تشق طريقها الخاص للأمام من خلال تولي مسؤولية شركة ناشئة خاصة بها في مجال الذكاء الاصطناعي.
من يحتاج نفيديا؟
في أبريل من العام الماضي، قامت تشو وشريكها المؤسس جريج دياموس، ومقره في بالو ألتو، بإخراج شركتهما الناشئة الجديدة، Lamini AI، من الخفاء. كان طموحها الرئيسي هو تقديم منصة تسهل على المؤسسات تدريب وإنشاء نماذج لغة كبيرة مخصصة باستخدام “أسطر قليلة فقط من التعليمات البرمجية”.
قد يعني ذلك أخذ نموذج أساسي مثل GPT من OpenAI وتسهيل قيام المؤسسة بضبط هذا النموذج باستخدام بياناتها الخاصة. وقال تشو: “ما نقوم به هو جعل من الممكن بشكل أساسي لكل مؤسسة أن تمتلك البنية التحتية لـ OpenAI ولكن داخل الشركة”.
ومع ذلك، جاء اكتشاف مثير للاهتمام بنفس القدر بعد أشهر.
في سبتمبر، كشف Zhou أن منصة Lamini كانت تبني برامج LLM مخصصة مع العملاء على مدار العام الماضي من خلال استخدام وحدات معالجة الرسوميات حصريًا من المنافس الرئيسي لـ Nvidia، AMD، عملاق الرقائق الذي تديره ابنة عم Huang، Lisa Su.
لقد كانت صفقة كبيرة نظرًا لأن الجميع تقريبًا كانوا مهووسين حصريًا بـ H100 – وحدات معالجة الرسوميات التي كافحت Nvidia لتلبية الطلب عليها وسط قيود العرض. حتى أن كشف Lamini جاء مع مقطع فيديو لـ Zhou وهو يضايق Nvidia بشأن النقص.
ومع ذلك، وكما يعترف تشو، لم يكن قرارًا سهلاً أن ننظر بعيدًا عن الشيء الذي كان الجميع في مجال الذكاء الاصطناعي يتوقون إليه بشدة. وقالت: “كانت عملية صنع القرار طويلة”. “لم تكن تافهة وصغيرة.”
بعض الأشياء ساعدت في اتخاذ القرار. على سبيل المثال، لعب شريكها المؤسس دياموس دورًا رئيسيًا في المساعدة على إدراك أن وحدات معالجة الرسوميات بخلاف تلك الموجودة في Nvidia تعمل بشكل جيد تمامًا.
بصفته مهندس برمجيات سابق في Nvidia، أدرك دياموس أنه على الرغم من أن أجهزة GPU كانت حيوية للحصول على أعلى أداء من نماذج الذكاء الاصطناعي – فقد كان، بعد كل شيء، مؤلفًا مشاركًا لورقة بحثية حول “قوانين القياس” التي أظهرت أهمية قوة الحوسبة – كانت البرمجيات هي مهم جدا.
كان دياموس شاهدًا على ذلك من خلال عمله على CUDA، البرنامج الذي طورته Nvidia لأول مرة في العقد الأول من القرن الحادي والعشرين. فهو يجعل استخدام نماذج الذكاء الاصطناعي مع وحدات معالجة الرسومات مثل H100 وشريحة Blackwell الجديدة من Nvidia، أمرًا بسيطًا مثل نظام التوصيل والتشغيل.
لذلك أصبح من الواضح أنه إذا تمكنت شركة أخرى من بناء نظام بيئي برمجي مماثل حول وحدات معالجة الرسومات الخاصة بها، فلن يكون هناك سبب يمنعها من التنافس مع Nvidia. ولحسن حظهم، وبعد التشاور مع دياموس، وفقًا لتشو، كانت AMD في طريقها لبناء نظام منافس سيختبرونه في النهاية.
قال تشو: “كنت أنا وجريج نعمل على الأشياء، لذلك استغرق الأمر سنوات في الإعداد، وبمجرد أن عملت النماذج الأولية، كنا نرغب في مضاعفة هذا الأمر”.
على نطاق أوسع، يدرك تشو أن الشركات “متحمسة للغاية لاستخدام شهادات الماجستير في القانون”، لكن الكثير منها قد لا يرغب – أو ببساطة لا يستطيع تحمل تكاليف ذلك – الانتظار حتى تقوم شركة Nvidia بدعم ما يكفي من وحدات معالجة الرسوميات الخاصة بها لتلبية الطلب.
وهذا سبب آخر لإثبات AMD قيمتها الكبيرة لطموحاتها. وبفضل توفر وحدات معالجة الرسوميات الخاصة بها بشكل أكبر، كان تشو واثقًا من أن شركة لاميني يمكنها تقديم “بنية تحتية تجعل تلبية هذا الطلب المتزايد” على حاملي شهادة الماجستير في القانون أمرًا ممكنًا.
وأوضحت: “هذا لأن Lamini يستخدم حوسبة LLM بشكل كامل بأداء 10x ويجعل من الممكن التوسع بسرعة دون قيود العرض، من خلال تقديم خيارات حوسبة غير محددة للبائعين، أي أنه لا يمكن للعملاء تمييز تشغيل Lamini على وحدات معالجة الرسوميات Nvidia وAMD”.
لا عجب أن الشركة مستعدة لمضاعفة جهودها على AMD. في يناير، شارك Zhou صورة لـ X لـ MI300X – شريحة AMD الجديدة التي كشف عنها الرئيس التنفيذي Su لأول مرة في ديسمبر باعتبارها “المسرع الأعلى أداءً في العالم” – وهي قيد الإنتاج في Lamini.
قد يكون Huang من Nvidia يقود إحدى أقوى الشركات في Silicon Valley الآن، لكن المنافسة قادمة بالنسبة له. أو كما قال تشو عن شركة AMD: “لديهم حصان حقيقي في هذا السباق”.