قطع شدن Cloudflare یک سوال در مورد اگر نیست، بلکه زمان است
Cloudflare به آخرین غول زیرساخت وب تبدیل شد که در عرض یک ماه از بین رفت و کل سایتها از جمله X، ChatGPT، Spotify، Canva و حتی DownDetector را برای نظارت بر قطعی، با یک پیام خطا برای ساعتها امروز صبح جایگزین کرد. این آخرین مورد از مجموعه قطعهایی است که مهدی داودی، مدیرعامل و یکی از بنیانگذاران پلتفرم پایش عملکرد اینترنت Catchpoint، گفت که باید زنگ خطری برای کسبوکارها باشد.
داودی میگوید: «همه تمام تخمهای خود را در یک سبد میگذارند و بعد از بروز مشکل غافلگیر میشوند. “وظیفه شرکت این است که مطمئن شود آنها افزونگی و انعطاف پذیری دارند.”
این قطعی پس از آن رخ می دهد که مشکلات مربوط به خدمات وب مایکروسافت آژور و آمازون تنها در عرض یک هفته از یکدیگر رخ می دهد و بخش بزرگی از اینترنت را که به ارائه دهندگان اصلی برای فعال نگه داشتن وب سایت های خود متکی هستند، از کار می اندازد. به همین ترتیب، Cloudflare بخش قابل توجهی از اینترنت را تامین می کند. وبسایتها را با شبکه تحویل محتوا آنلاین نگه میدارد، در حالی که خدمات متعدد دیگری از جمله محافظت در برابر حملات DDoS و DNS ارائه میدهد. سال گذشته، این شرکت اعلام کرد که حدود 20 درصد از وب از طریق شبکه Cloudflare عبور می کند. همچنین به 35٪ از شرکت های Fortune 500 و همچنین “میلیون ها” مشتری دیگر خدمات ارائه می دهد.
عملکرد سریع و رکورد امنیتی Cloudflare آن را به یک انتخاب محبوب برای وبسایتها در سراسر جهان تبدیل کرده است، اما این قطعی اخیر توجه را به تمرکز صنعت زیرساخت وب جلب میکند. پس از قطع شدن AWS برنامه پیامرسانی ایمن Signal، مردیث ویتاکر، رئیس این سرویس، گفت که این شرکت چارهای جز استفاده از یک ارائهدهنده بزرگ ابری برای اجرا ندارد. او نوشت: «کل پشته اساساً متعلق به 3-4 بازیکن است.
“حتی انحرافات کوچک می تواند عواقب عظیمی داشته باشد.”
اما حتی برای شرکتهایی که تنها به چند ارائهدهنده زیرساخت وب متکی هستند، آخرین زنجیره قطعیها روشن میکند که آنها به یک طرح پشتیبان نیاز دارند. داودی میگوید: «اختلالها رخ میدهد و به دفعات بیشتر اتفاق میافتد. شعاع انفجار همچنان رشد خواهد کرد.» حد. “سوال این است که شما در مورد آن چه می کنید؟”
در حالی که مایکروسافت و AWS قطعیهای خود را به مشکلات DNS مرتبط کردهاند، سیستمی که نامهای دامنه وبسایت را به آدرسهای IP ترجمه میکند، Cloudflare خرابی آن را در یک فایل ردیابی کرد. جکی داتون، سخنگوی Cloudflare، گفت: «علت اصلی این قطعی یک فایل پیکربندی خودکار ایجاد شده برای مدیریت ترافیک تهدید بود. “فایل فراتر از اندازه مورد انتظار ورودی ها رشد کرد و باعث خرابی سیستم نرم افزاری شد که ترافیک تعدادی از سرویس های Cloudflare را مدیریت می کند.”
ممکن است بیهوده به نظر برسد که یک مشکل فایل مانند این می تواند کل مناطق اینترنت را از بین ببرد، اما برای شرکت هایی به بزرگی Cloudflare، این ممکن است رخ دهد. راب لی، رئیس هوش مصنوعی و تحقیقات در موسسه SANS میگوید: «وقتی زیرساختها را در مقیاس Cloudflare اجرا میکنید، حتی انحرافات کوچک میتواند عواقب بزرگی داشته باشد. حد. این پلتفرمها برای سرعت طراحی شدهاند، بنابراین هر چیزی که تصمیمگیری را به تأخیر میاندازد یا مسدود میکند، میتواند به سرعت اتفاق بیفتد. در محیطهای با عملکرد بالا، یک تاخیر میلیثانیه میتواند به یک بلوک کامل از ترافیک تبدیل شود.»
به گفته لی، یک فایل پیکربندی مانند Cloudflare's “راهنماهای مسیریابی خط مشی های امنیتی، تصمیمات تعادل بار و نحوه توزیع ترافیک در سطح جهانی” را توضیح می دهد. لی می افزاید: اگر حجم فایل به طور ناگهانی افزایش یابد، “می تواند باعث تجزیه کند، مشکلات حافظه، درگیری های CPU یا خطاهای منطقی در سیستم هایی شود که به آن متکی هستند.”
AWS به طور مشابه «اتوماسیون معیوب» را برای ایجاد زنجیره ای از مشکلات که منجر به قطعی گسترده اخیر آن شد، اشتباهی که احتمالاً دوباره تکرار می شود، مقصر دانست. آیا قرار است هر بار که کلودفلر عطسه می کند، شکایت کنید؟ داودی می گوید. “یا می خواهید اطراف آن بسازید؟”
منبع: theverge
