بررسی اختلال کلودفلر در ۲۰ فوریه ۲۰۲۶ که ناشی از یک خطای نرم افزاری بود

بررسی اختلال کلودفلر در ۲۰ فوریه ۲۰۲۶ که ناشی از یک خطای نرم افزاری بود

تیم تحریریه استاد آیتی گزارش می دهد: در یک روز عادی از ماه فوریه سال ۲۰۲۶، دنیای دیجیتال بار دیگر شاهد یک رویداد نگران کننده بود. شرکت کلودفلر، غول زیرساخت اینترنت و ارائه دهنده خدمات امنیتی و شبکه، در تاریخ ۲۱ فوریه ۲۰۲۶ با یک اختلال گسترده مواجه شد. این حادثه که به مدت ۶ ساعت و ۷ دقیقه به طول انجامید، دسترسی بخش قابل توجهی از مشتریان این شرکت را به اینترنت مختل کرد و بار دیگر اهمیت پایداری و تاب آوری شبکه های جهانی را به کانون توجه آورد. این اختلال کلودفلر، نه تنها برای کاربران و کسب و کارهای متکی به خدمات این شرکت، بلکه برای کل اکوسیستم اینترنت، پیامدهای قابل تاملی داشت.

جزئیات فنی اختلال: خطایی در قلب سیستم BYOIP

بر اساس گزارش رسمی کلودفلر، ریشه این اختلال در یک خطای نرم افزاری در زیرسیستم Addressing API این شرکت نهفته بود. این خطا در حین اجرای یک وظیفه پاکسازی دوره ای در سیستم Bring Your Own IP (BYOIP) رخ داد. سیستم BYOIP به مشتریان کلودفلر اجازه می دهد تا آدرس های IP خود را به شبکه جهانی کلودفلر بیاورند و از خدمات آن بهره مند شوند.

وظیفه پاکسازی مذکور، که بخشی از تلاش های کلودفلر برای خودکارسازی فرآیندهای دستی و افزایش تاب آوری شبکه تحت برنامه “Code Orange: Fail Small” بود، به اشتباه باعث “پس گرفتن” (withdrawal) حدود ۱۱۰۰ پیشوند (prefix) BGP از شبکه شد.

BGP و “پس گرفتن پیشوند” چه معنایی دارد؟

پروتکل دروازه مرزی (BGP) ستون فقرات مسیریابی اینترنت است. این پروتکل به روترها در سراسر جهان اجازه می دهد تا اطلاعات مربوط به مسیرهای موجود برای رسیدن به شبکه های مختلف را با یکدیگر مبادله کنند. هنگامی که یک پیشوند BGP “پس گرفته می شود”، به این معنی است که روترهای کلودفلر به سایر روترهای اینترنت اعلام می کنند که دیگر نمی توانند ترافیک مربوط به آن آدرس های IP را مسیریابی کنند.

چگونه کلودفلر با Code Mode، مصرف توکن ابزارهای هوش مصنوعی را ۹۹ درصد کاهش می دهد؟

این اتفاق به طور مستقیم منجر به عدم دسترسی و قطعی برای کاربرانی می شود که از آن آدرس های IP استفاده می کنند. این پدیده می تواند منجر به “BGP Path Hunting” شود، جایی که روترها به دنبال مسیرهای جایگزین می گردند تا زمانی که اتصال به طور کامل قطع شود.

تاثیرات گسترده بر خدمات و کاربران

این اختلال کلودفلر، اگرچه به طور مستقیم بر سرویس DNS بازگشتی ۱.۱.۱.۱ تاثیر نگذاشت، اما وب سایت مربوط به آن با خطای ۴۰۳ “Edge IP Restricted” مواجه شد. تاثیر اصلی بر مشتریانی بود که از خدمات BYOIP کلودفلر استفاده می کردند. این مشتریان شاهد قطعی و عدم دسترسی به وب سایت ها و برنامه های کاربردی خود بودند. خدمات کلیدی دیگری که تحت تاثیر قرار گرفتند عبارتند از:

  • خدمات اصلی CDN و امنیتی: ترافیک به سمت کلودفلر جذب نمی شد و کاربران با خطای اتصال مواجه می شدند.
  • اسپکتروم (Spectrum): برنامه های Spectrum که از BYOIP استفاده می کردند، قادر به پروکسی کردن ترافیک نبودند.
  • خروج اختصاصی (Dedicated Egress): مشتریانی که از Gateway Dedicated Egress یا Dedicated IPs برای CDN Egress با BYOIP استفاده می کردند، قادر به ارسال ترافیک به مقاصد خود نبودند.
  • مجیک ترانزیت (Magic Transit): کاربران نهایی که به برنامه های محافظت شده توسط Magic Transit متصل می شدند، با زمان بندی و خطاهای اتصال مواجه شدند.

روند بازیابی و چالش ها

مهندسان کلودفلر به سرعت برای بازگرداندن وضعیت به حالت عادی وارد عمل شدند. ابتدا تغییر مشکل ساز را برگرداندند و سپس با انتشار راهنمایی، به مشتریان BYOIP امکان دادند تا با استفاده از داشبورد کلودفلر، آدرس های IP خود را مجدداً تبلیغ (re-advertise) کنند.

این اقدام باعث بازیابی حدود ۸۰۰ پیشوند شد. با این حال، حدود ۳۰۰ پیشوند دیگر به دلیل یک باگ نرم افزاری در سیستم، که تنظیمات مربوط به آنها را از سرورهای لبه (edge servers) حذف کرده بود، نیاز به بازیابی دستی توسط مهندسان کلودفلر داشتند. این فرآیند بازیابی کامل ۶ ساعت و ۷ دقیقه به طول انجامید.

“Code Orange: Fail Small” و درس های آموخته شده

نکته قابل تامل در این حادثه این است که خود اختلال ناشی از فرآیندی بود که قرار بود بخشی از برنامه “Code Orange: Fail Small” باشد. این برنامه که پس از چندین اختلال بزرگ در سال های ۲۰۲۵ و اوایل ۲۰۲۶ توسط کلودفلر آغاز شد، با هدف افزایش تاب آوری شبکه و اطمینان از اینکه تغییرات به صورت کنترل شده و مرحله ای اعمال می شوند، طراحی شده است. هدف اصلی این برنامه، کاهش دامنه تاثیر هرگونه خطا یا اشتباه در شبکه بود.

کارشناسان استاد آی تی معتقدند که این حادثه، با وجود اینکه ناشی از یک خطای نرم افزاری بود، نشان دهنده پیچیدگی های ذاتی مدیریت زیرساخت های ابری در مقیاس جهانی است. حتی با وجود برنامه های جامع تاب آوری مانند “Code Orange: Fail Small”، خطاهای انسانی یا نرم افزاری می توانند منجر به اختلالات قابل توجهی شوند. این رویداد بر اهمیت تست دقیق، استقرار مرحله ای (phased deployment) و مکانیزم های بازگشت سریع (rollback mechanisms) در سیستم های حیاتی تاکید می کند.

واژه نامه تخصصی این خبر

  • BGP (Border Gateway Protocol): پروتکل دروازه مرزی، پروتکل اصلی مسیریابی در اینترنت که اطلاعات مسیرها را بین سیستم های مستقل (AS) مبادله می کند.
  • BYOIP (Bring Your Own IP): قابلیتی که به مشتریان اجازه می دهد آدرس های IP خود را به شبکه ارائه دهنده خدمات ابری بیاورند.
  • Addressing API: رابط برنامه نویسی کاربردی که برای مدیریت و پیکربندی آدرس های IP در شبکه کلودفلر استفاده می شود.
  • Edge Computing: پردازش داده ها در نزدیکی منبع تولید داده، به جای ارسال آن به یک مرکز داده مرکزی.
  • Propagation: انتشار یا گسترش اطلاعات پیکربندی در سراسر شبکه.
  • Prefix Withdrawal: پس گرفتن یک پیشوند BGP، به معنی اعلام عدم توانایی مسیریابی ترافیک برای آن محدوده IP.
  • BGP Path Hunting: پدیده ای که در آن روترها در هنگام عدم دسترسی به یک پیشوند، به دنبال مسیرهای جایگزین می گردند.
  • Recursive DNS: سرویس DNS که درخواست های کاربران را برای یافتن آدرس IP یک دامنه به صورت بازگشتی حل می کند.
  • CDN (Content Delivery Network): شبکه توزیع محتوا، سیستمی از سرورهای توزیع شده که محتوا را به کاربران نزدیک تر می کند تا سرعت دسترسی افزایش یابد.
  • DDoS Protection: حفاظت در برابر حملات محروم سازی از سرویس توزیع شده، که هدف آن از کار انداختن یک سرویس با حجم بالای ترافیک است.
  • Code Orange: Fail Small: ابتکار کلودفلر برای افزایش تاب آوری شبکه و کاهش دامنه تاثیر اختلالات.

نگاهی به آینده: پایداری در دنیای متصل

این اختلال کلودفلر، هرچند ناخوشایند بود، اما فرصتی برای یادگیری و بهبود فراهم آورد. شرکت هایی مانند کلودفلر که نقش حیاتی در زیرساخت اینترنت ایفا می کنند، همواره در تلاشند تا سیستم های خود را در برابر خطاها مقاوم تر سازند. این حادثه بار دیگر نشان داد که حتی پیشرفته ترین سیستم ها نیز می توانند آسیب پذیر باشند و نیاز به نظارت مداوم، بهبود فرآیندها و سرمایه گذاری در فناوری های جدید برای افزایش پایداری شبکه جهانی اینترنت وجود دارد.

جمع بندی

اختلال کلودفلر در فوریه ۲۰۲۶، یادآور شکنندگی زیرساخت های دیجیتال و اهمیت حیاتی پایداری شبکه است. این حادثه که ناشی از یک خطای نرم افزاری در سیستم BYOIP بود، نشان داد که حتی با وجود برنامه های جامع تاب آوری، نیاز به دقت و بهبود مستمر در فرآیندهای توسعه و استقرار وجود دارد. درس های آموخته شده از این رویداد، مسیر را برای آینده ای امن تر و پایدارتر در دنیای فناوری هموار می سازد. این رویداد همچنین بر اهمیت درک عمیق پروتکل های زیربنایی اینترنت مانند BGP و مکانیزم های مدیریت IP تاکید می کند تا از تکرار چنین حوادثی جلوگیری شود.


منبع:
Cloudflare outage on February 20, 2026

این پست چقدر مفید بود؟

بر روی یک ستاره کلیک کنید تا به آن امتیاز دهید!

میانگین امتیاز ۵ / ۵. میانگین امتیاز: ۲

تاکنون هیچ رأیی ثبت نشده است! اولین نفری باشید که به این پست امتیاز می‌دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *