في صباح يوم الجمعة، عانى مستخدمو الإنترنت حول العالم من انقطاع مفاجئ في العديد من الخدمات الرقمية الهامة، بما في ذلك LinkedIn و Zoom. يعود سبب هذا التعطيل إلى مشكلة في البنية التحتية لشركة Cloudflare، وهي شركة رائدة في مجال توفير خدمات الإنترنت و حماية المواقع، و التي أعلنت لاحقًا عن استعادة الخدمات بشكل كامل. هذا الحادث يمثل الثاني من نوعه الذي يؤثر على Cloudflare في غضون أقل من ثلاثة أسابيع، مما يثير تساؤلات حول استقرار البنية التحتية للإنترنت و الاعتماد المتزايد على عدد قليل من الشركات الكبرى في هذا المجال.
ما الذي حدث مع Cloudflare؟
أكدت Cloudflare أن المشكلة لم تكن نتيجة لهجوم إلكتروني، بل كانت ناتجة عن تغيير في طريقة تعامل جدار الحماية الخاص بها مع طلبات المستخدمين. و أوضحت الشركة أن هذا التغيير “تسبب في عدم توفر شبكة Cloudflare لعدة دقائق”، مما أدى إلى تعطل الوصول إلى المواقع التي تعتمد على خدماتها. بالإضافة إلى ذلك، أشارت Cloudflare إلى أنها تحقق في المشكلات المتعلقة بلوحة التحكم الخاصة بها وواجهات برمجة التطبيقات (APIs) المرتبطة بها، و هي الأدوات التي تسمح لأنظمة البرامج المختلفة بالتواصل مع بعضها البعض.
تحليل أسباب الانقطاع
خبراء الأمن السيبراني يؤكدون أن تحديد السبب الجذري لانقطاع كهذا يستغرق وقتًا دقيقًا. ووفقًا للبيانات الأولية التي قدمتها Cloudflare، يبدو أن الحادث ناتج عن خطأ في التكوين أثناء إجراء تغييرات في قاعدة البيانات كجزء من الصيانة المخطط لها. يقول ريتشارد فورد، كبير مسؤولي التكنولوجيا في Integrity360: “هذا التغيير أثقل كاهل أنظمتهم بشكل فعال”. هذا يؤكد على أهمية الاختبارات الشاملة قبل تطبيق أي تغييرات على البنية التحتية الأساسية.
تأثير انقطاع Cloudflare على الخدمات المختلفة
لم يقتصر تأثير انقطاع Cloudflare على الشركات الكبرى مثل LinkedIn و Zoom فحسب، بل امتد ليشمل خدمات أخرى متنوعة. فعلى سبيل المثال، اضطر مطار إدنبره في اسكتلندا إلى الإغلاق لفترة وجيزة صباح الجمعة، على الرغم من أن إدارة المطار أوضحت لاحقًا أن هذا الإغلاق كان ناتجًا عن مشكلة محلية منفصلة و ليس له علاقة بانقطاع Cloudflare.
و يذكر أن انقطاعًا سابقًا في نوفمبر الماضي استمر لمدة ثلاث ساعات و أثر على مستخدمي خدمات مثل ChatGPT، و لعبة League of Legends، و نظام النقل العام في نيو جيرسي. هذا يدل على مدى الاعتماد الواسع على Cloudflare و تأثير أي مشكلة تواجهها على نطاق واسع من الخدمات.
تكرار الانقطاعات في خدمات الحوسبة السحابية
لا يقتصر الأمر على Cloudflare، فخلال الشهر الماضي، واجهت مايكروسوفت مشكلة مماثلة في بوابة Azure السحابية الخاصة بها، مما منع المستخدمين من الوصول إلى خدمات Office 365 و Minecraft وغيرها. و أوضحت مايكروسوفت أن تغييرًا في التكوين في البنية التحتية لـ Azure كان السبب الرئيسي في هذا الانقطاع. كما شهدت أمازون انقطاعًا كبيرًا في خدمات الحوسبة السحابية الخاصة بها في أكتوبر.
هذه الأحداث المتكررة تثير المخاوف بشأن استقرار خدمات الحوسبة السحابية و البنية التحتية للإنترنت بشكل عام. و يرى الخبراء أننا سنشهد المزيد من هذه الانقطاعات في المستقبل، خاصة مع تزايد اعتماد الشركات على عدد قليل من مقدمي الخدمات السحابية.
و يقول فورد: “إننا نشهد زيادة في التكرار مع قيام المؤسسات بوضع المزيد من البيض في عدد أقل من السلال، ومع زيادة تعقيد وحجم وحجم العمليات مثل AWS، وGoogle Cloud، وMicrosoft Azure، و Cloudflare“. هذا يعني أن أي خطأ أو مشكلة في أحد هذه الأنظمة يمكن أن يكون له تأثير كبير على عدد كبير من المستخدمين و الخدمات.
أهمية التنويع و التخطيط للطوارئ
تؤكد هذه الحوادث على أهمية تنويع مصادر البنية التحتية للإنترنت و وضع خطط للطوارئ للتعامل مع أي انقطاع محتمل. يجب على الشركات و المؤسسات أن تفكر في استخدام خدمات متعددة من مقدمي خدمات مختلفين لتقليل الاعتماد على شركة واحدة.
بالإضافة إلى ذلك، يجب أن يكون لدى الشركات خطط واضحة للتعامل مع حالات الطوارئ، بما في ذلك استعادة البيانات و تحويل حركة المرور إلى خوادم بديلة. هذه الخطط يجب أن تخضع لاختبارات منتظمة لضمان فعاليتها في حالة حدوث انقطاع حقيقي.
الخلاصة: نحو بنية تحتية إنترنت أكثر مرونة
انقطاع Cloudflare الأخير هو تذكير بأن البنية التحتية للإنترنت ليست معصومة من الخطأ. مع تزايد اعتمادنا على الخدمات الرقمية، يصبح من الضروري أكثر من أي وقت مضى الاستثمار في بناء بنية تحتية إنترنت أكثر مرونة و استقرارًا. يجب على الشركات و الحكومات العمل معًا لضمان استمرار الوصول إلى الإنترنت و الخدمات الرقمية الأساسية، حتى في حالة حدوث انقطاع أو أزمة.
هذه الحوادث تدعو إلى التفكير بشكل جدي في بناء شبكة إنترنت أكثر لامركزية و توزيعًا، و التي تقلل من نقاط الضعف المحتملة و تزيد من قدرتها على الصمود في وجه أي تحديات. كما يجب التركيز على تطوير أدوات و تقنيات أفضل لمراقبة و تشخيص المشكلات في البنية التحتية للإنترنت، و التي تسمح بالاستجابة السريعة و الفعالة لأي انقطاع.
