Cloudflare объяснила, как обрушила интернет
18 ноября часть глобальных интернет-сервисов — включая ChatGPT, Claude, Spotify, X и ряд других — оказалась недоступна из-за масштабного сбоя в инфраструктуре Cloudflare. Компания объяснила причину сбоя.
Проблема затронула множество сайтов и приложений, зависящих от инфраструктуры компании, которая обслуживает около 20% всех веб-ресурсов в мире.
Cloudflare сообщила на своем сайте, что первые неполадки были обнаружены около 8:00 по восточному времени США. Спустя меньше двух часов компания объявила, что внедрила исправление и услуги «возвращаются к нормальной работе», однако некоторые клиенты все еще могут испытывать трудности с доступом.
Технический директор Cloudflare Дэйн Кнект объяснил причину в посте X: сбой вызвал «латентный баг» — скрытая ошибка в сервисе, который лежит в основе системы защиты от ботов. По его словам, проблема проявилась после рутинного изменения конфигурации и вызвала каскадный отказ сети и других сервисов.
«Это не была атака. Мы подвели наших клиентов и весь интернет», — написал Кнект, добавив, что компания уже работает над тем, чтобы подобное не повторилось. Он пообещал опубликовать подробный разбор инцидента в ближайшие часы: «Я знаю, что это принесло реальный ущерб сегодня».
Сбой произошел менее чем через месяц после аналогичной массовой проблемы в Amazon Web Services и вновь продемонстрировал, насколько зависим интернет от нескольких крупных инфраструктурных игроков. Cloudflare управляет сетью из 330 дата-центров и сотрудничает более чем с 13 тысячами сетей по всему миру, включая крупнейших операторов связи и облачные платформы.
Читать на dev.by