في العام الماضي ، واجهت أعمال التجزئة الضخمة في Amazon مشكلة كبيرة: لم يتمكن من الحصول على ما يكفي من رقائق الذكاء الاصطناعى لإنجاز العمل الحاسم.

مع تأخير المشاريع ، أطلقت أكبر عملية للتجارة الإلكترونية في العالم الغربي تجديدًا جذريًا للعمليات الداخلية والتكنولوجيا لمعالجة هذه المشكلة ، وفقًا لما ذكره مجموعة من وثائق Amazon التي حصل عليها Business Insider.

تقدم المبادرة نظرة من الداخل نادرة على كيفية قيام عملاق التكنولوجيا بموازنة الطلب الداخلي على مكونات GPU هذه مع العرض من NVIDIA ومصادر الصناعة الأخرى.

في أوائل عام 2024 ، كانت طفرة الذكاء الاصطناعي التوليدي على قدم وساق ، حيث تتنافس الآلاف من الشركات على الوصول إلى البنية التحتية اللازمة لتطبيق هذه التكنولوجيا الجديدة القوية.

داخل أمازون ، ذهب بعض الموظفين شهورًا دون تأمين وحدات معالجة الرسومات ، مما أدى إلى تأخيرات عطلت إطلاق المشروع في الوقت المناسب عبر قسم البيع بالتجزئة التابع للشركة ، وهو قطاع يمتد على منصة التجارة الإلكترونية والعمليات اللوجستية الموسعة ، وفقًا للوثائق الداخلية.

في يوليو ، أطلقت Amazon Project Greenland ، “تجمع سعة GPU المركزي” لإدارة وتخصيص محدودية وحدة معالجة الرسومات. شددت الشركة أيضًا بروتوكولات الموافقة على استخدام وحدة معالجة الرسومات الداخلية.

وذكر أحد إرشادات الأمازون: “إن وحدات معالجة الرسومات هي ذات قيمة كبيرة بحيث لا يمكن تقديمها على أساس من يأتي أولاً يخدم أولاً”. “بدلاً من ذلك ، يجب تحديد التوزيع استنادًا إلى طبقة العائد على الاستثمار مع اعتبارات الحس السليم ، وتوفير النمو طويل الأجل للتدفق النقدي الحر للشركة.”

بعد عامين من نقص عالمي ، تظل وحدات معالجة الرسومات سلعة نادرة – حتى لبعض أكبر شركات الذكاء الاصطناعى. على سبيل المثال ، قال الرئيس التنفيذي لشركة Openai Sam Altman في فبراير إن صانع Chatgpt كان “خارج وحدة معالجة الرسومات” ، بعد إطلاق نموذج جديد. قال Nvidia ، مزود GPU المهيمن ، إنها ستثبت هذا العام.

ومع ذلك ، فإن جهود أمازون لمعالجة هذه المشكلة قد تؤتي ثمارها. وبحلول ديسمبر / كانون الأول ، اقترحت التوقعات الداخلية أن الأزمة ستخفف هذا العام ، حيث من المتوقع أن يتحسن توافر الرقاقة.

في رسالة بريد إلكتروني إلى BI ، قال متحدث باسم Amazon إن ذراع البيع بالتجزئة للشركة ، والتي تصدر وحدات معالجة الرسومات من خلال Amazon Web Services ، لديها الآن وصول كامل إلى معالجات الذكاء الاصطناعى.

وقال المتحدث باسم “Amazon لديها قدرة وافرة على وحدة معالجة الرسومات على مواصلة الابتكار لأعمال التجزئة والعملاء الآخرين في جميع أنحاء الشركة”. “AWS المعترف بها في وقت مبكر على أن ابتكارات الذكاء الاصطناعى التوليدي تعمل على تعزيز التبني السريع لخدمات الحوسبة السحابية لجميع عملائنا ، بما في ذلك Amazon ، وقمنا بتقييم احتياجات GPU المتزايدة لعملائنا واتخذنا خطوات لتقديم السعة التي يحتاجونها لدفع الابتكار.”

“جاهز للمجرفة”

تتطلب Amazon الآن بيانات صلبة وإثبات الإرجاع على كل طلب داخلي من GPU ، وفقًا للوثائق التي حصلت عليها BI.

يتم “إعطاء الأولوية ومرتبة المبادرات” لتخصيص GPU بناءً على عدة عوامل ، بما في ذلك اكتمال البيانات المقدمة والفائدة المالية لكل وحدة معالجة الرسومات. يجب أن تكون المشاريع “جاهزة للمجرفة” ، أو معتمدة من أجل التنمية ، وإثبات أنها في “سباق” تنافسي إلى السوق. عليهم أيضًا توفير جدول زمني لوقت تحقيق الفوائد الفعلية.

ذكرت واحدة من المستندات الداخلية من أواخر عام 2024 أن وحدة البيع بالتجزئة في Amazon خططت لتوزيع وحدات معالجة الرسومات على “مبادرات الأولوية الأعلى التالية” حيث أصبح المزيد من العرض متاحًا في الربع الأول من عام 2025.

تولد الأولوية الأوسع لأعمال تجارة التجزئة في Amazon في ضمان أن الإنفاق على البنية التحتية السحابية يولد “أعلى عائد على الاستثمار من خلال نمو الإيرادات أو الحد من التكلفة” ، وهي إحدى الوثائق.

وحدة معالجة الرسومات الجديدة لـ Amazon “مبادئ”

قام فريق البيع بالتجزئة في Amazon بتدوين نهجه في “المبادئ” الرسمية-إرشادات داخلية تخلقها الفرق أو المشاريع الفردية لاتخاذ القرارات بشكل أسرع. تؤكد المبادئ على عائد استثمار قوي ، وموافقات انتقائية ، ودفع للسرعة والكفاءة.

وإذا كان مشروع Greenlit LunderDelives ، فيمكن سحب وحدات معالجة الرسومات الخاصة به.

فيما يلي 8 مبادئ لتخصيص GPU ، وفقًا لواحدة من وثائق Amazon:

  1. ROL + ارتفاع الحكم مطلوب لتحديد أولويات استخدام GPU. تعد وحدات معالجة الرسومات ذات قيمة GPU على أساس من يأتي أولاً يخدم أولاً. بدلاً من ذلك ، يجب تحديد التوزيع استنادًا إلى طبقة ROL مع اعتبارات الحس السليم ، وتوفير النمو طويل الأجل للتدفق النقدي الحر للشركة. يمكن أن يحدث التوزيع في البنية التحتية المفصلة أو في ساعات من أداة المشاركة/التجميع.
  2. تعلم باستمرار وتقييم وتحسين: نحن نطلب أفكارًا جديدة بناءً على المراجعة المستمرة ونحن على استعداد لتحسين نهجنا ونحن نتعلم المزيد.
  3. تجنب قرارات صومعة: تجنب اتخاذ القرارات بمعزل عن غيرها ؛ بدلاً من ذلك ، قم بتركيز تتبع مبادرات GPU و GPU المتعلقة في مكان واحد.
  4. الوقت أمر بالغ الأهمية: الأدوات القابلة للتطوير هي مفتاح التحرك بسرعة عند اتخاذ قرارات التوزيع التي تتيح بدورها مزيدًا من الوقت للابتكار والتعلم من تجاربنا.
  5. الابتكار في الكفاءة: تمهد الكفاءة الطريق للابتكار من خلال تشجيع الاستخدام الأمثل للموارد ، وتعزيز التعاون وتبادل الموارد.
  6. احتضان المخاطر في السعي لتحقيق الابتكار: سيسمح المستوى المقبول من تحمل المخاطر بتبني فكرة “الفشل السريع” والحفاظ على بيئة تفضي إلى البحث والتطوير.
  7. الشفافية والسرية: نشجع الشفافية حول منهجية تخصيص GPU من خلال التعليم والتحديثات على الويكي مع تطبيق السرية حول المعلومات الحساسة حول البحث والتطوير ومكافحة العائد على الاستثمار مع أصحاب المصلحة المحدودين فقط. نحتفل بالفوز وتبادل الدروس المستفادة على نطاق واسع.
  8. قد يتم استدعاء وحدات معالجة الرسومات التي تم تقديمها مسبقًا للأساطيل إذا أظهرت مبادرات أخرى قيمة أكبر. وجود وحدة معالجة الرسومات لا يعني أنك ستحتفظ بها.

مشروع غرينلاند

لمعالجة تعقيد إدارة عرض GPU والطلب ، أطلقت Amazon مشروعًا جديدًا يسمى Greenland العام الماضي.

وقال أحد الوثائق إن غرينلاند يوصف بأنه “منصة تزامن GPU المركزية لتبادل سعة GPU عبر الفرق وزيادة الاستخدام”.

أوضحت الوثائق أن يمكن أن تتبع استخدام وحدة معالجة الرسومات العالمية لكل مبادرة ، ومشاركة خوادم الخمول ، وتنفيذ “clawbacks” لإعادة تخصيص الرقائق إلى مشاريع أكثر إلحاحًا. يوفر النظام أيضًا تحديثات شبكات مبسطة وتحديثات أمان ، مع تنبيه الموظفين والقادة إلى مشاريع ذات استخدام منخفض في GPU.

وأضافت أن موظفي Amazon هذا العام “مفوضون” على الذهاب عبر جرينلاند للحصول على قدرة GPU على “جميع المطالب المستقبلية” ، وتتوقع الشركة أن تزيد من الكفاءة عن طريق “الحد من السعة الخاملة وتحسين استخدام الكتلة”.

1 مليار دولار استثمار في المشاريع المتعلقة بالنيابة

لا تضيع أعمال التجزئة في Amazon وقتًا في وضع وحدات معالجة الرسومات الخاصة بها. أدرجت مستند واحد أكثر من 160 من المبادرات التي تعمل بنظام الذكاء الاصطناعى ، بما في ذلك مساعد Rufus Shopping Productant ومولد صور منتج THEIA.

تشمل مشاريع الذكاء الاصطناعي الأخرى في الأعمال ، وفقًا للوثيقة:

  • خدمة استرجاع الحزم بمساعدة الرؤية (VAPR) تستخدم تقنية الرؤية للكمبيوتر لمساعدة السائقين على تحديد واختيار الحزم الصحيحة من الشاحنات عند توقف التسليم.
  • الخدمة التي تسحب البيانات تلقائيًا من مواقع الويب الخارجية لإنشاء معلومات منتج متسقة.
  • نموذج AI جديد يعمل على تحسين توجيه السائق ومعالجة الحزم لتقليل أوقات التسليم وتحسين الكفاءة.
  • وكيل خدمة العملاء المحسّن يستخدم اللغة الطبيعية لمعالجة استفسارات عودة العملاء.
  • خدمة تتم أتمتة تحقيقات الاحتيال في البائع والتحقق من امتثال الوثائق.

في العام الماضي ، قدرت Amazon أن استثمارات الذكاء الاصطناعى من خلال أعمال التجزئة الخاصة بها ساهمت بشكل غير مباشر 2.5 مليار دولار في الأرباح التشغيلية. أسفرت هذه الاستثمارات أيضًا إلى ما يقرب من 670 مليون دولار في وفورات متغيرة في التكاليف.

من غير الواضح ما هي تقديرات 2025 لتلك المقاييس. لكن أمازون تخطط لمواصلة الإنفاق بشكل كبير على الذكاء الاصطناعي.

اعتبارًا من أوائل هذا العام ، توقعت ذراع البيع بالتجزئة من Amazon حوالي مليار دولار من الاستثمارات لمشاريع الذكاء الاصطناعي التي تعمل بنظام GPU. بشكل عام ، يتوقع قسم البيع بالتجزئة إنفاق حوالي 5.7 مليار دولار على البنية التحتية لـ AWS Cloud في عام 2025 ، ارتفاعًا من 4.5 مليار دولار في عام 2024 ، وفقًا للوثائق الداخلية.

تحسين القدرة

في العام الماضي ، فإن قائمة أمازون الثقيلة لمشاريع الذكاء الاصطناعي تضع ضغطًا على إمدادات GPU.

خلال النصف الثاني من عام 2024 ، عانت وحدة البيع بالتجزئة في Amazon من نقص في الإمداد بأكثر من 1000 حالة P5 ، وهو خادم Cloud من AWS يحتوي على ما يصل إلى 8 NVIDIA H100 GPU ، حسبما قال أحد الوثائق منذ ديسمبر. كان من المتوقع أن يتحسن نقص P5 قليلاً بحلول أوائل هذا العام ، والتحول إلى فائض في وقت لاحق في عام 2025 ، وفقًا لتقديرات ديسمبر.

وقال المتحدث باسم Amazon لـ BI أن التقديرات أصبحت الآن “عفا عليها الزمن” ، ولا يوجد حاليًا أي نقص في وحدة معالجة الرسومات.

وقال أحد الوثائق إنه من المتوقع أن يفيدر من AWS من AI Chip Treerium أيضًا طلب قسم البيع بالتجزئة بحلول نهاية عام 2025 ، ولكن “ليس عاجلاً”.

تتماشى تحسين قدرة أمازون مع تصريحات آندي جاسي اعتبارًا من فبراير ، عندما قال إن قيود GPU والخادم “ستستريح” بحلول النصف الثاني من هذا العام.

ولكن حتى مع هذه الجهود ، هناك علامات على أن أمازون لا تزال تشعر بالقلق بشأن إمدادات GPU.

أقرت قائمة الوظائف الأخيرة من فريق غرينلاند أن النمو المتفجر في طلب GPU أصبح التحدي المميز لهذا الجيل: “كيف نحصل على المزيد من قدرة GPU؟”

هل تعمل في أمازون؟ هل لديك نصيحة؟ اتصل بهذا المراسل عبر البريد الإلكتروني على ekim@businessinsider.com أو إشارة أو برقية أو WhatsApp على 650-942-3061. استخدم عنوان بريد إلكتروني شخصي وجهاز غير عمل ؛ إليك دليلنا لمشاركة المعلومات بشكل آمن.