- تقدم شريحة Blackwell من Nvidia تحديات تبريد للعملاء.
- التقارير التي تفيد بأن ارتفاع درجة الحرارة سيؤدي إلى إبطاء منحدر بلاكويل “مبالغ فيها”، وفقًا لتحليل Semiana Analysis.
- يعد اعتماد التبريد السائل أمرًا بالغ الأهمية لمراكز البيانات للتعامل مع الرقائق المتقدمة.
لقد قوبل طرح شريحة Blackwell، وهي الشريحة الأكثر تقدمًا على الإطلاق من Nvidia، بالإثارة والقلق.
أولاً، كانت هناك مشكلات في تصميم الرقائق، والتي قال الرئيس التنفيذي جنسن هوانغ منذ ذلك الحين إنها تم حلها بالكامل. أصبح التبريد الآن في قمة أولوياتنا بعد صدور تقرير من The Information يفصل مخاوف عدد قليل من عملاء Nvidia من أن التكوينات الأكبر لشرائح Blackwell، الأكثر تقدمًا في السوق، كانت محمومة.
صرح ديلان باتيل، كبير المحللين في Semianasis لموقع Business Insider، أنه على الرغم من أن التبريد سيكون مصدر قلق كبير مع تكثيف شركة Blackwell، وبالنسبة لجميع الرقائق بعد ذلك، فقد تم حل مشكلات تصميم Blackwell المتعلقة بالتبريد.
وقال باتيل لـ Insider: “أعتقد أن المشكلات المحمومة كانت موجودة منذ أشهر وتمت معالجتها إلى حد كبير”. وقال إن الشائعات حول ارتفاع درجة حرارة الرقائق تعود إلى الصيف.
ونشر باتيل على موقع X في أغسطس: “عندما نتعقبهم، نجد أن هذه الأمور مبالغ فيها”.
في أغسطس/آب، أفادت شركة سيمي أناليسيس، التي تضم فريقا يضم أكثر من اثني عشر خبيرا يراقبون كل جانب من جوانب صناعة أشباه الموصلات، أن مشكلات نشأت مع أنظمة التبريد، مما أدى إلى إعادة العمل من قبل العديد من الموردين. ووصف فريق من خمسة محللين في تقرير أغسطس التغييرات بأنها “بسيطة”.
إن القوة الحاسوبية الهائلة التي تعلن عنها شركة Nvidia لشركة Blackwell، أو أي شريحة أخرى، تعتمد على تصميم النظام وكيفية إعداده واستخدامه. قد يختلف عدد الأميال بناءً على كيفية تثبيت الرقائق وربطها ببعضها البعض وتبريدها وبرمجتها.
على الرغم من أن التبريد الفعال يمكن أن يكون متعطشًا للطاقة، وبالتالي مكلفًا، إلا أن له تأثيرًا كبيرًا على قدرة مشغلي مراكز البيانات على تحقيق الربح.
تتوقف الرقائق المحمومة عن العمل ببساطة حتى تبرد، وتؤثر القدرة على إبقائها باردة على مقدار الحوسبة التي يمكن أن تقوم بها كل شريحة في فترة زمنية معينة. تؤثر تكاليف التوقف والتبريد على التكلفة الإجمالية للملكية طوال العمر الإنتاجي للرقاقة.
“قضايا التسنين”
لقد تم توجيه الكثير من الاهتمام مؤخرًا نحو GB200 NVL72، الذي يمثل حدودًا جديدة لمراكز البيانات. يأتي الرقم “72” في اللقب من 72 وحدة معالجة رسومات Blackwell في الخادم، بالإضافة إلى 36 وحدة معالجة مركزية تقليدية.
نظرًا لأن العديد من الرقائق يتم تجميعها معًا بشكل محكم لتعمل كرقاقة واحدة فائقة، فإن الأبراج تصبح ساخنة جدًا وتتطلب تبريدًا سائلًا.
التبريد السائل ليس جديدًا، لكن القيام بذلك على نطاق مراكز البيانات كان نادرًا نسبيًا حتى الآن. مع بدء المتوسعين الفائقين وعدد قليل مختار من عملاء Nvidia الآخرين في تلقي شرائحهم خلال بقية عام 2024 وفي النصف الأول من عام 2025، يجب إجراء التعديلات، وفي بعض الحالات، يتم جلب المباني الجديدة عبر الإنترنت.
وبحسب ما ورد قامت شركة Meta بإعادة تصميم تصميم مركز البيانات الخاص بها ليأخذ في الاعتبار زيادة كثافة الطاقة واحتياجات التبريد للأجيال القادمة من شرائح الذكاء الاصطناعي.
وقال باتيل: “ستكون هناك مشاكل في مرحلة التسنين”. وتابع: “ليس لدى الناس أفضل الممارسات، فالجميع يتعلمون كيفية القيام بذلك معًا”.
سيتم بناء مراكز بيانات جديدة للتبريد السائل، ولكن سيتم تحديث العديد من المرافق الحالية. هذه مهمة صعبة إلى حد ما. بالإضافة إلى أن جميع المكونات ملائمة تمامًا لتجنب تسرب قطرة واحدة، يجب أن تدور السوائل في درجات حرارة محددة.
وقال باتيل لـ BI: من المرجح أن تشهد عملية الانتقال لحظات أكثر حرجًا.
وقال متحدث باسم Nvidia لـ BI: “التكرارات الهندسية طبيعية ومتوقعة”.
بالإضافة إلى التحديات الهندسية والتشغيلية، فإن التبريد السائل على نطاق واسع يجلب معه قائمة من المخاوف البيئية. قالت وثيقة داخلية من أمازون، حصل عليها يوجين كيم، كبير مراسلي BI، إن أمازون “تضغط على البنية التحتية الحالية للولايات القضائية المحلية” للمياه في بعض المناطق و”تعتمد على ترقيات البنية التحتية طويلة المدى أو بناء حلولنا الخاصة” للتخفيف من حدة المشكلة. . (أخبر متحدث باسم أمازون BI أن مراكز بياناتها كانت أكثر كفاءة في استخدام المياه من متوسط الصناعة).
وعلى الرغم من العمل الشاق والضغوط البيئية الناجمة عن التحول إلى التبريد السائل، فإن الحوافز قوية.
كتب محللو سيميناليزس في أكتوبر: “إن أي مركز بيانات غير راغب أو غير قادر على تقديم تبريد سائل عالي الكثافة سيفوت تحسينات الأداء الهائلة في التكلفة الإجمالية للملكية لعملائه وسيتخلف عن سباق ذراع Geneative AI”.
شركات التبريد تستعد لهذا التحول. سجلت أسهم Vertiv، وهي شركة البنية التحتية لمراكز البيانات، أعلى مستوى لها على الإطلاق يوم الثلاثاء.
وقال باتيل إن المشكلات السابقة المتعلقة بتصميم شرائح بلاكويل وتحديات تثبيت أنظمة بلاكويل أدت إلى تقليص عدد الرقائق التي يتم شحنها هذا العام. قدر التحليل النصفي أن 200.000 سيتم شحنها هذا العام التقويمي، معظمها إلى المتوسعين الفائقين. وتتوقع شركات الحوسبة السحابية الصغيرة أن تتلقى الرقائق في ربيع عام 2025، على الرغم من أن بعضها لا يزال غير متأكد من عدد الرقائق التي سيتم تخصيصها ومتى يمكن أن تحصل عليها.
وقال باتيل إنه على الرغم من التحديات المتعددة، فإن بلاكويل تتوسع بسرعة
وعد هوانغ بإيرادات بمليارات الدولارات من بلاكويل هذا العام على أرباح الشركة لشهر أغسطس وهذا ما من المرجح أن تركز عليه الشركة خلال مكالمة الأربعاء.
انخفض سهم Nvidia يوم الاثنين بعد تقرير ارتفاع درجة الحرارة. وبحلول منتصف نهار الثلاثاء، كان قد ارتفع فوق سعره عند إغلاق السوق يوم الجمعة.