Джон П. Мелло младший
9 июня 2021 г., 4:00 утра по тихоокеанскому времени
Во вторник из-за ошибки конфигурации в системах поставщика услуг по доставке контента из строя были отключены многочисленные веб-сайты и приложения по всему миру
Провайдер Fastly, поддерживающий такие бренды, как CNN, The Guardian, New York Times, Hulu, Reddit, HBO Max и Spotify, испытал сбой примерно в 5:49 утра по восточному времени в США и начал восстанавливаться в 6:39
Согласно Национальному общественному радио, во время отключения посетители, пытающиеся получить доступ к CNN.com, получали сообщение «Быстрая ошибка: неизвестный домен: cnn.com». На веб-сайте New York Times и правительства Великобритании появилось сообщение «Ошибка 503 Служба недоступна» вместе со строкой «Сервер кеширования Varnish». Varnish — это технология, используемая Fastly.
Когда TechNewsWorld связалась с представителями службы поддержки Fastly по поводу сбоя, представитель Fastly ответил следующим образом: «Все узлы кеш-памяти Fastly теперь восстановлены в нашей глобальной сети. Мы определили конфигурацию службы, которая вызвала сбои в наших точках присутствия по всему миру, и мы отключил эту конфигурацию ".
Содержание статьи
Сети доставки контента
Быстро — это то, что известно как сеть доставки контента. Сети CDN существуют уже более 20 лет, хотя за это время они эволюционировали и расширились.
«Большая часть контента в Интернете, с которым взаимодействуют пользователи, предоставляется им сетями доставки контента», — заметил Дуг Мэдори, директор по интернет-анализу в Kentik, компании по наблюдению за сетями в Сан-Франциско.
«В отрасли произошла некоторая консолидация; поэтому, когда случается сбой, он может вывести из строя множество вещей», — сказал он TechNewsWorld.
Энди Шампань, старший вице-президент в офисе технического директора Akamai, поставщика услуг по доставке контента и облачной безопасности в Кембридже, штат Массачусетс, объяснил, что перекачка контента из одного места физически не сработает для контент-провайдеров.
«Вы не можете построить достаточно большое место, достаточно связанное и достаточно близко ко всему», — сказал он TechNewsWorld. «Вот почему у нас есть около 300 000 серверов по всему миру для распространения контента».
«Все, кто сегодня является крупным брендом, и даже более мелкие бренды используют сети доставки контента для распространения своего контента», — продолжил он.
«Одна из проблем Интернета заключается в том, что масштаб может застать вас врасплох», — сказал он. «Внезапно что-то может стать чрезвычайно популярным. Люди внезапно могут захотеть скачать это, послушать, воспроизвести, посмотреть, купить. Вот где действительно могут помочь CDN. Они могут мгновенно масштабироваться».
Снижение задержки
Джонатан Таннер, старший исследователь безопасности в Barracuda Networks, поставщике решений для обеспечения безопасности и хранения данных из Кэмпбелла, Калифорния, объяснил, что в сетях доставки контента обычно размещается часто загружаемый контент, например в виде изображений для других веб-сайтов или даже целых веб-сайтов, распределенным образом, чтобы ускорить загрузку.
«По сути, они будут размещать один и тот же контент в нескольких центрах обработки данных по всему миру, и когда пользователь переходит на веб-сайт, который загружает контент из CDN, он загружает этот контент из ближайшего к этому пользователю центра обработки данных», он сказал TechNewsWorld.
"Это снимает нагрузку с полосы пропускания с их клиента, поскольку файлы большего размера не загружаются с собственных серверов клиента CDN, а также обеспечивает меньшую задержку для пользователей, обслуживая контент из географически более близкого к этому пользователю местоположения, чем то, где веб-сайт клиент CDN находится на хостинге ", — сказал он.
«Заказчик CDN может разместить копии всего своего сайта в нескольких центрах обработки данных для достижения того же эффекта, — добавил он, — но это потребует гораздо больше накладных расходов, чем просто найм такой компании, как Fastly, которая делает это в больших масштабах. "
Multiplying Disaster
Хотя подробности о конфигурации службы, вызвавшей сбой в Fastly, еще не обнародованы, сети CDN могут иметь много движущихся частей, и системы постоянно обновляются .
«Провайдер обычно тестирует обновления поэтапно, чтобы убедиться, что обновление не вызовет проблем», — пояснил Мадори. «Иногда из соображений целесообразности они вносят изменения на лету, которые не проходят такое же тщательное тестирование».
Плохая конфигурация может привести к полному сбою программного обеспечения или может заблокировать необходимые ресурсы для правильной работы программного обеспечения — любой из этих факторов может вызвать сбой, отметил Таннер.
«По самой природе работы сетей CDN один и тот же код и контент размещаются во многих различных центрах обработки данных по всему миру», — сказал он. «Таким образом, если неправильная конфигурация выйдет из строя, она, возможно, будет распространена на все эти центры обработки данных и вызовет сбой».
Он объяснил, что сети CDN могут быть более устойчивыми к сбоям, чем другие типы систем, потому что если одна центр обработки данных выходит из строя, пользователи будут направлены в ближайший центр обработки данных за контентом.
«Однако, — добавил он, — проблема с основным программным обеспечением во всех центрах обработки данных, несомненно, приведет к отказу всей службы».
Обновляйте медленно
Если что-то и можно извлечь из сбоя Fastly, так это то, как распределенные сети играют сегодня критическую роль в Интернете и насколько важно убедиться, что программное обеспечение распределенные системы работают правильно.
«Надеюсь, это также проиллюстрировало важный момент о том, как лучше обрабатывать обновления в будущем», — сказал Таннер. «То есть не нацеливаться на каждый центр обработки данных сразу, а скорее медленно развертывать программное обеспечение и проверять, что оно работает должным образом, прежде чем выдвигать серьезные изменения».
«Для CDN или любых других распределенных архитектур, гарантируя, что обновления — чтобы программное обеспечение и настройка выполнялись поэтапно, а не для всех центров обработки данных одновременно, это, безусловно, поможет предотвратить подобные виды сбоев в будущем », — заметил он
.
«Тем, кто использует CDN, наличие плана действий на случай такого сбоя также будет полезным, чтобы сократить время простоя», — добавил он.
Не только Fastly столкнулся с перебоями в работе.
В октябре 2019 года в результате кибератаки на Amazon Web Services клиенты остались без доступа к важной информации более чем на 10 часов. Между тем, в прошлом году клиенты IBM Cloud пострадали из-за перебоев в обслуживании в июне, клиенты Cloudflare жаловались на посетителей, испытывающих проблемы с доступом к их веб-сайтам и сервисам, в июле, а в ноябре еще один случайный сбой AWS нарушил обслуживание клиентов на Восточном побережье США.