هناك طفل جديد في مبنى LLM.
أطلقت شركة Databricks، وهي شركة برمجيات بيانات سحابية، نموذجًا جديدًا للذكاء الاصطناعي يوم الأربعاء – وتقول الشركة إنه أسرع وأرخص وأكثر كفاءة من منافسيها الأكبر.
وقال علي قدسي، المؤسس المشارك والرئيس التنفيذي لشركة Databricks، لموقع Business Insider في مقابلة: “تحصل على سرعة مضاعفة، وهي أرخص بكثير، لكنك تحصل على ذكاء النماذج الأكبر حجمًا”.
يأتي النموذج، المسمى DBRX، في وقت يشهد منافسة شرسة في مجال الذكاء الاصطناعي التوليدي. أطلقت كل من OpenAI، وMeta، وGoogle، وXAI الخاصة بـ Elon Musk، روبوتات الدردشة الخاصة بها خلال العامين الماضيين.
وتقول شركة Databricks إن نموذجها يمكن أن يتفوق على بعض منافسيها في فهم اللغة والبرمجة والرياضيات والمنطق من خلال الاعتماد على “مزيج من الخبراء”. هؤلاء يمكن اعتبارها نماذج أصغر للذكاء الاصطناعي، يحتوي كل منها على خبرته الخاصة، والتي تشكل نموذج اللغة الكبير الإجمالي وتتعامل مع الطلبات بقوة حاسوبية أقل بكثير.
مع المزيد من “الخبراء”، يمكن لـ DBRX إنتاج أجزاء من النص باستخدام معلمات أقل – العناصر القابلة للتعديل داخل النموذج التي تساعد روبوت الدردشة على تفسير النص وإنشاءه.
بدأت شركة Databricks في بناء النموذج في شهر يناير تقريبًا. وقال قدسي إن الأمر استغرق 10 ملايين دولار وشهرين لتدريب النموذج على البيانات العامة.
يُعد DBRX، المتوفر كمصدر مفتوح، تتويجًا لعملية شراء الشركة لشركة MosaicML الناشئة التي تعمل بالذكاء الاصطناعي بقيمة 1.3 مليار دولار في يوليو الماضي، حيث ساعد العديد من موظفيها في بناء DBRX.
تم تدريب النموذج مسبقًا على حوالي 3000 وحدة معالجة رسوميات Nvidia H100، وهو طلب على الطاقة أقل بكثير من منافسيه، وفقًا لقدسي. شاركت شركة تصنيع الرقائق في جولة تمويل السلسلة الأولى من Databricks بقيمة 500 مليون دولار في سبتمبر.
وقالت الشركة أيضًا إن نموذج DBRX بأكمله يحتوي على 132 مليار معلمة. وقال قدسي خلال عرض توضيحي يوم الاثنين في سان فرانسيسكو: “في أي وقت من الأوقات”، يستخدم النموذج حوالي 36 مليار معلمة للتعامل مع الطلبات.
وقال باتريك ويندل، المؤسس المشارك للشركة ونائب رئيس قسم الهندسة، يوم الاثنين، إن النماذج مفتوحة المصدر يمكن أن تؤدي إلى مزيد من التنوع من خلال السماح لشركات أو مجموعات أخرى بالبناء على نموذج Databricks.
وقال ويندل: “هناك الكثير من المجموعات التي تعرف كيفية بناء نماذج رائعة”.
وأضاف: “ما يمكننا فعله هو تمكين العديد من العملاء من بناء نماذجهم الخاصة”.
نافين راو، الذي شارك في تأسيس MosaicML في عام 2021 قبل الاستحواذ على Databricks، أخبر BI سابقًا أنه إذا كان بإمكان الشركات الاعتماد على بياناتها الخاصة لتدريب نموذج مفتوح المصدر، فلن تضطر إلى القلق بشأن التحديات القانونية مثل دعاوى انتهاك حقوق الطبع والنشر التي لقد تم طرحها بالفعل على OpenAI وMicrosoft.
أخبر قدسي BI أن فريقًا في Databricks كان مسؤولاً عن تصفية المواد المحمية بحقوق الطبع والنشر من البيانات المستخدمة لتدريب DBRX.