- يتخذ Groq نهجًا جديدًا للتنافس مع برنامج CUDA من Nvidia الذي نال استحسانًا كبيرًا.
- تستخدم الشركة الناشئة للرقائق طبقة استدلال مجانية لجذب مئات الآلاف من مطوري الذكاء الاصطناعي.
- تهدف Groq إلى الاستحواذ على حصة السوق من خلال الاستدلال الأسرع والمشاريع المشتركة العالمية.
هناك جدل نشط حول الخندق التنافسي لـ Nvidia. يقول البعض إن هناك تصورًا سائدًا حول الاختيار “الآمن” عند استثمار المليارات في التكنولوجيا، حيث لا يزال العائد غير مؤكد.
يقول الكثيرون إنه برنامج Nvidia، وخاصة CUDA، الذي بدأت الشركة في تطويره قبل عقود من ازدهار الذكاء الاصطناعي. يتيح CUDA للمستخدمين تحقيق أقصى استفادة من وحدات معالجة الرسومات.
لقد حاول المنافسون إنشاء أنظمة قابلة للمقارنة، ولكن بدون انطلاقة Nvidia، كان من الصعب إقناع المطورين بالتعلم والمحاولة وتحسين أنظمتهم في النهاية.
ومع ذلك، فإن شركة Groq هي أحد منافسي شركة Nvidia التي ركزت في وقت مبكر على شريحة حوسبة الذكاء الاصطناعي التي تتطلب حاجة أقل لرقائق البرمجة المباشرة، مما أثار اهتمام المستثمرين. بلغت قيمة الشركة الناشئة العاملة في مجال شرائح الذكاء الاصطناعي والتي تبلغ من العمر 8 سنوات 2.8 مليار دولار في جولة السلسلة D البالغة 640 مليون دولار في أغسطس.
على الرغم من أن مستثمرًا واحدًا على الأقل قد وصف شركات مثل Groq بأنها “مجنونة” لمحاولتها تقويض حصة Nvidia المقدرة بـ 90٪ من السوق، إلا أن الشركة الناشئة كانت تبني تقنيتها خصيصًا للفرصة التي ستأتي في عام 2025، وفقًا لمارك هيبس، “كبير المبشرين التكنولوجيين” في Groq. قال.
“إطلاق العنان للوحش”
وقال هيبس: “ما قررنا القيام به هو أخذ جميع حساباتنا، وإتاحتها عبر مثيل سحابي، ومنحناها للعالم مجانًا”. داخليًا، أطلق الفريق على الإستراتيجية اسم “إطلاق العنان للوحش”. تحدد الطبقة المجانية لـ Groq المستخدمين بسقف محدد للطلبات يوميًا أو الرموز المميزة في الدقيقة.
أمضى Heaps والرئيس التنفيذي وموظف Google السابق جوناثان روس وفريق ضعيف نسبيًا عامي 2023 و2024 في توظيف المطورين لتجربة تقنية Groq. من خلال الهاكاثونات والمسابقات، تقطع الشركة وعدًا – جرب الأجهزة عبر منصة Groq السحابية مجانًا، واخترق الجدران التي اصطدمت بها مع الآخرين.
تقدم Groq بعضًا من أسرع الاستدلالات المتاحة، وفقًا لتصنيفات Artificialanalys.ai، التي تقيس التكلفة ووقت الاستجابة للشركات التي تسمح للمستخدمين بشراء الوصول إلى نماذج محددة عن طريق الرمز المميز – أو الناتج.
الاستدلال هو نوع من الحوسبة ينتج إجابات على الاستفسارات المطروحة على نماذج اللغات الكبيرة. التدريب، والمزيد من الطاقة–النوع المكثف من الحوسبة، هو ما يمنح النماذج القدرة على الإجابة. حتى الآن، كانت الأجهزة المستخدمة لهاتين المهمتين مختلفة.
قال Heaps والعديد من زملائه الذين يتحدون Nvidia في شركات مثل Cerebras وSambaNova Systems أن السرعة هي ميزة تنافسية.
وقال إنه بعد أن أصبحت خدمة الاستدلال متاحة مجانًا، خرج المطورون من الأعمال الخشبية، بمشاريع لا يمكن أن تنجح على الرقائق الأبطأ. وبسرعة أكبر، يمكن للمطورين إرسال طلب واحد من خلال نماذج متعددة واستخدام نموذج آخر لاختيار أفضل استجابة – كل ذلك في الوقت الذي تستغرقه عادةً تلبية طلب واحد فقط.
وقال Heaps إن ما يقرب من 652000 مطور يستخدمون الآن مفاتيح Groq API.
تتوقع Heaps أن تجذب السرعة المطورين إلى Groq. لكن خطتها الجديدة لبرمجة شرائحها تمنح الشركة نهجًا فريدًا تجاه العنصر الأكثر أهمية داخل “الخندق” الخاص بشركة Nvidia.
لا حاجة لمكتبات CUDA
وقال هيبس: “سيحتاج الجميع، بمجرد نشر النماذج، إلى استنتاج أسرع وبتكلفة أقل، وهذا ما ركزنا عليه”.
فأين هو ما يعادل CUDA؟ كل شيء في المنزل.
“لدينا في الواقع أكثر من 1800 نموذج مدمج في مترجمنا. نحن لا نستخدم أي نواة، ولا نحتاج إلى أشخاص لاستخدام مكتبات CUDA. ولهذا السبب، يمكن للأشخاص البدء في العمل مع نموذج مدمج،” Heaps قال.
وقال إن التدريب يتطلب المزيد من التخصيص على مستوى الرقائق. استنتاجًا، تتمثل مهمة Groq في اختيار النماذج المناسبة لتقدمها للعملاء والتأكد من تشغيلها بأسرع ما يمكن.
وأضاف: “ما ترونه مع هذا العدد الهائل من المطورين الذين يقومون ببناء تطبيقات الذكاء الاصطناعي – أنهم لا يريدون البرمجة على مستوى الرقائق”.
الاستراتيجية تأتي مع مستوى معين من المخاطر. من غير المرجح أن يجمع Groq مجموعة مستقرة من المطورين الذين يقومون باستمرار باستكشاف الأخطاء وإصلاحها وتحسين برامجها الأساسية مثل CUDA. قد يكون عرضه أشبه بقائمة مطعم أكثر من متجر بقالة. ولكن هذا يعني أيضًا أن حاجز الدخول لمستخدمي Groq هو نفسه مثل أي مزود سحابي آخر وربما يكون أقل من حاجز الرقائق الأخرى.
وقال هيبس إنه على الرغم من أن شركة Groq بدأت كشركة ذات تصميم جديد للرقائق، إلا أن 60% من موظفي الشركة البالغ عددهم حوالي 300 موظف، اليوم هم مهندسو برمجيات.
وقال: “بالنسبة لنا في الوقت الحالي، هناك صناعة ناشئة تبلغ قيمتها مليارات ومليارات الدولارات، ويمكننا أن نستحوذ على حصة كبيرة من السوق، بينما في الوقت نفسه، نواصل تطوير المترجم”.
على الرغم من كونه واقعيًا بشأن المدى القريب، فإن لدى Groq طموحات نبيلة، والتي وصفها الرئيس التنفيذي لمجلس الإدارة جوناثان روس بأنها “توفر نصف الاستدلال العالمي”. ويقول روس أيضًا إن الهدف هو إلقاء شبكة فوق الكرة الأرضية، وهو ما يمكن تحقيقه من خلال المشاريع المشتركة. السعودية في الطريق. كندا وأمريكا اللاتينية قيد الإعداد.
في وقت سابق من هذا العام، أخبر روس BI أن الشركة تهدف أيضًا إلى شحن 108000 من وحدات معالجة اللغة أو LPUs بحلول الربع الأول من العام المقبل – و2 مليون شريحة بحلول نهاية عام 2025، معظمها سيكون متاحًا من خلال سحابته.
هل لديك نصيحة أو فكرة للمشاركة؟ اتصل بإيما على ecosgrove@businessinsider.com أو استخدم تطبيق المراسلة الآمن Signal: 443-333-9088