• تظهر نماذج AI الجديدة التي تظهر أنها يمكن أن تعمل مع عدد قليل من رقائق Nvidia.
  • Google هي شركة واحدة تتبع DeepSeek في صنع الذكاء الاصطناعى الأكثر قوة تتطلب حسابًا أقل.
  • لا يبدو الأمر وكأنه مشكلة على مستوى Deepseek لـ Nvidia-ولكن هناك تحذيرات.

يقوم جيل جديد من نماذج الذكاء الاصطناعى بضغط المزيد من الطاقة من عدد أقل من الرقائق. ما إذا كانوا يثيرون ذعرًا آخر على نطاق Deepseek على Nvidia هو مسألة أخرى.

قاد Google رسوم هذا الأسبوع مع مجموعة من النماذج الأصغر – Gemma 3 – التي تبدو وكأنها تحزم لكمة خطيرة مع عمل فذ: إنها تعمل بسلاسة مع رقاقة nvidia واحدة ، والمعروفة باسم GPU.

كشف النقاب عن النماذج يوم الأربعاء ، سلط الرئيس التنفيذي لشركة Google Sundar Pichai الضوء على كفاءتها في منشور X ، حيث كتبت “ستحتاج إلى 10x على الأقل للحصول على أداء مماثل من طرز أخرى.”

كما أصدرت شركة Cohere ، وهي شركة ناشئة مقرها في تورنتو بقيادة Googler Aidan Gomez السابق ، نموذجًا جديدًا يوم الخميس يسمى Command A ، والذي يوصف بأنه نموذج “أحدث” يعمل على وحدات معالجة الرسومات فقط. (قام Business Insider ، إلى جانب الناشرين الآخرين ، بمقاضاة Cohere على انتهاك حقوق الطبع والنشر.)

أحد الدروس الرئيسية التي نقلها Deepseek إلى العالم عندما أصدرت نموذج AI في يناير كان القدرة على بذل المزيد من الجهد بأقل. وقالت الشركة الناشئة الصينية إن نموذج R1 الخاص به كان قادرًا على المنافسة مع نموذج O1 من Openai مع الادعاء بأنه يحتاج إلى عدد أقل من الرقائق.

أثارت المطالبة أكبر تمحو ليوم واحد في تاريخ سوق الأسهم في الولايات المتحدة ، حيث فقدت Nvidia ما يقرب من 600 مليار دولار. تساءل السوق عما إذا كان أكثر كفاءة من الذكاء الاصطناعي سيقلل من الطلب على رقائق NVIDIA-الطلب الذي ساعده في تحقيق إيرادات قياسية كاملة في عام 2024 بقيمة 130.5 مليار دولار.

للوهلة الأولى ، يبدو أن هذه الموجة الجديدة من نماذج الذكاء الاصطناعى تشكل تهديدًا أكبر ، لأنها تدعي أنها حديثة بينما تحتاج فقط إلى حفنة من وحدات معالجة الرسومات.

أظهر مخطط لأداء Gemma في Arginboard chatbot Arena ، على سبيل المثال – الذي شاركه Pichai – أن النموذج تفوق على الأداء من Deepseek و Openai و Meta أثناء تشغيله على وحدة معالجة الرسومات أقل.

ولكن لمجرد أن المزيد من الشركات تتعلم الضغط على المزيد من الأداء من الذكاء الاصطناعي مع عدد أقل من الرقائق ، فليس من المعطى أن هذه النماذج الأكثر كفاءة ستستمر في تشكيل خطر على طراز Deepseek على Nvidia.

لأحد ، مع تكشف ملحمة Deepseek ، سارع المديرون التنفيذيون للتكنولوجيا إلى ملاحظة ظاهرة تعرف باسم Jevons Paradox. يشير المبدأ الاقتصادي إلى أنه عندما تصبح التكنولوجيا أكثر كفاءة ، فإن استهلاك تلك التكنولوجيا سيزيد – لا ينخفض.

قد يساعد ذلك في توضيح سبب قيام Google نفسها بتقسيمها لزيادة النفقات الرأسمالية المرتبطة بمنظمة العفو الدولية هذا العام إلى 75 مليار دولار ، والتي تتضمن عادةً وحدات معالجة الرسومات الموجودة في مراكز البيانات المهمة لمنظمة العفو الدولية.

لقد كانت Google واحدة من المشترين الرئيسيين في أحدث جيل من GPUs Nvidia – رقائق Blackwell التي تم تقديمها في العام الماضي – لذلك من المعقول أن نتوقع أن يكونوا من بين من هم على استعداد للإنفاق على GPU Nvidia الجديد يكشف عنه في حدث GTC الأسبوع المقبل.

حتى الآن ، لا يبدو أن السوق يشعر بالقلق من أحدث تطورات كفاءة الرقاقة – ارتفع سعر سهم Nvidia بنحو 6 ٪ منذ يوم الثلاثاء.

هناك تحذير صغير لهذا.

على الرغم من أن نماذج GEMMA الجديدة من Google يمكنها استخدام وحدة معالجة الرسومات NVIDIA واحدة لتشغيلها ، إلا أنه يبدو أن تدريب النماذج الجديدة قد حدث مع رقائق Google الخاصة ، والمعروفة باسم وحدات معالجة Tensor ، أو TPUs.

قضى عمالقة التكنولوجيا مثل Google سنوات في العمل على السيليكون الخاص بهم كوسيلة لتقليل اعتمادهم على NVIDIA ، لذلك فإن GEMMA تشكل موقفًا غريبًا أنتجت Google نموذجًا تنافسيًا لمنظمة العفو الدولية دون استخدام أي وحدات معالجة الرسومات NVIDIA للتدريب.

ومع ذلك ، فمن غير المرجح أن تقلل شركة مثل Google اعتمادها على وحدات معالجة الرسومات Nvidia بطريقة مهمة في أي وقت قريب – ولسبب بسيط.

تحدث دفعة الشركة لإنتاج نماذج أكثر كفاءة إلى جانب تطويرها لنماذج Gemini AI الأكثر قوة ، واسعة النطاق ، والتي تهدف إلى دفع حدود الذكاء. يعتمد نجاح هذه النماذج ، في الوقت الحالي ، على الوصول إلى أكبر قدر ممكن من الحساب.

تم التحقق من صحة هذا النهج مؤخرًا من خلال إصدار Grok 3 ، وهو أحدث طراز Frontier AI من بدء تشغيل Elon Musk. جاء إصدارها مع ملاحظة مفادها أن نسخة مستقبلية من النموذج سيتم تدريبها على مجموعة أكبر من GPU 200،000.

يبدو أن مستقبل تطور الذكاء الاصطناعي يشبه مسارين مختلفان يظهران في ترادف: واحد تظهر فيه النماذج الأصغر والأكثر كفاءة يتم تشغيلها على عدد أقل من وحدات معالجة الرسومات ، وآخر لا يزال فيه النماذج واسعة النطاق قد ألقيت عليها أكبر عدد ممكن من وحدات معالجة الرسومات.

شاركها.
Exit mobile version