Веб-сайт по обнаружению сбоев в работе службы Downdetector 19 ноября сообщил, что у службы инфраструктуры Интернета Amazon Web Services (AWS), которую многие веб-сайты и приложения используют в качестве основы, возникли проблемы.
Исторические данные Downdetector показывают, что AWS также испытывала проблемы 2 и 16 ноября.
«Сбои в облаке очень необычны», — сказала E-Commerce Times Кристин Браун, старший менеджер по связям с общественностью Amazon Web Services, когда ее спросили об аварии 19 ноября.
Панель мониторинга работоспособности сервисов Amazon «показывает, что все работает нормально … без серьезных сбоев», — сказал Браун. «У нас миллионы клиентов. Если бы действительно был сбой в обслуживании, мы, вероятно, увидели бы больше отчетов в дополнение к панели мониторинга работоспособности службы, сообщающей о сбоях».
Глобальная инфраструктура AWS разделена на регионы и зоны доступности для надежности, добавил Браун.
Amazon «часто видит неверные отчеты на таких сайтах, как Downdetector, по ряду причин», — заметил Браун. «В облачную инфраструктуру, в частности AWS, встроено много избыточности и безопасности».
Downdetector защищал точность своих данных.
Компания «собирает отчеты о состоянии из ряда источников, включая Twitter и отчеты, представленные на наших веб-сайтах и в мобильных приложениях», — сказал E-Commerce Адриан Блюм, вице-президент по маркетингу и коммуникациям в Ookla, материнской компании Downtector. Times.
«Наша система проверяет и анализирует эти отчеты в режиме реального времени, что позволяет нам автоматически обнаруживать сбои в работе и сбои в обслуживании на самых ранних стадиях», — пояснила она. «У нас нет проблем с неверной отчетностью».
Впоследствии, 25 ноября, отключение AWS привело к отключению «тысяч онлайн-сервисов», — сообщает ZDNet.
Содержание статьи
Важность облачных сервисов
«Рабочие нагрузки переносятся в общедоступные облака даже быстрее, чем ожидалось, и размещенные программные приложения особенно привлекательны для предприятий, преодолевших всемирную пандемию», — сказал Джон Динсдейл, главный аналитик компании Synergy Research Group, занимающейся маркетинговыми исследованиями.
«Быстрому внедрению также способствует множество гибридных облачных сервисов, которые помогают сгладить путь к более широкому использованию общедоступных облаков».
Расходы предприятий на облачные сервисы увеличились на 1,5 миллиарда долларов в третьем году. По данным SRG, из-за пандемии переход от локальных операций к облачным сервисам ускоряется.
Инфраструктура как услуга (IaaS), платформа как услуга (PaaS) и программное обеспечение как услуга (SaaS), которые предлагаются на основе подписки, выросли примерно на три процентных пункта больше, чем ожидалось.
Компании, предлагающие свои услуги или платформы в облаке на основе подписки, включают Microsoft с ее Office 360 и другими услугами; гигант Salesforce по управлению взаимоотношениями с клиентами (CRM); Google и Amazon AWS.
Исследование рынка облачных вычислений IDG за 2020 год, опубликованное в июне, показало, что 81 процент из более чем 550 опрошенных организаций уже используют облачную инфраструктуру или имеют приложения в облаке.
Существуют общедоступные облака, например, предлагаемые Google, Amazon и Microsoft; частные облака, такие как облачный сервис IBM; и гибридные облака, которые представляют собой комбинацию этих двух.
Недавние сбои
Какова реальная стоимость, когда пользователи не могут получить доступ к облачной службе?
Тысячи пользователей по всему миру потеряли доступ к Gmail, Google Drive, Google Docs, Google Meet и Google voice 20 августа, когда облачные сервисы Google во всем мире перестали работать на несколько часов.
В конце сентября в результате глобального сбоя был отключен Azure Active Directory (AD), облачное решение Microsoft для управления идентификацией и доступом, которое является основой облачной системы Office 365.
Клиенты не могли получить доступ к Teams, Microsoft 365 и другим онлайн-сервисам компании.
Авария AWS 25 ноября, которая длилась несколько часов, затронула тысячи онлайн-сервисов, от Adobe Spark до Roku до Flickr, интеллектуальных устройств, криптовалютных порталов, а также сервисов потоковой передачи и подкастов.
Частные облачные сервисы не стали лучше.
В июне во всем мире произошел сбой IBM Cloud. В июле маршрутизатор на глобальной магистрали веб-инфраструктуры и службы системы доменных имен (DNS) Cloudflare провайдер безопасности веб-сайтов неправильно маршрутизировал Интернет-трафик в течение примерно получаса, нарушив большую часть Интернета.
Простой может стоить предприятиям, которые зависят исключительно от способности центра обработки данных предоставлять ИТ-услуги и сетевые услуги клиентам, например компаниям электронной коммерции, до 11 000 долларов в минуту, по данным Evolven, технологической компании, предоставляющей ИТ-операции. Аналитические решения (ITOA) для предприятий.
Стоимость для предприятий, предпринимателей и частных лиц, использующих услуги подписки в своей работе, еще не рассчитана.
Evolven предлагает следующее уравнение для расчета потери дохода из-за простоя:
(GR / TH) x I x H, где GR = годовой валовой доход; TH = общее количество рабочих часов в год, I = влияние в процентах и H = количество часов простоя.
Гигантская задача
Сбои в облачных сервисах невозможно предотвратить, потому что «это сложные системы, которые проходят техническое обслуживание на уровне компонентов и почти всегда подвергаются атакам», — сказал Роб Эндерле, руководитель Enderle Group. The E-Commerce Times.
Например, сбой AWS 20 ноября произошел из-за того, что Amazon увеличил емкость клиентского кластера своей службы Kinesis, а внутренние серверы по техническим причинам не успели уловить изменения.
Kinesis обеспечивает обработку потоковых данных в реальном времени и используется непосредственно клиентами AWS, а также другими сервисами AWS.
Тем не менее, сбои можно смягчить, и встроить избыточность, поэтому пользователи редко их видят, заметил Эндерл.
При этом, «повышение избыточности, отказоустойчивости и безопасности — это постоянный процесс с поставщиками облачных услуг», — отметил он. «Но бюджеты не безграничны, так что некоторое признание того, что сбои произойдут, понятно и, если они краткие, в основном принимается».
Вот где управление рисками — процесс выявления, оценки и контроля угрозы капиталу и прибыли организации — входит.
Угрозы или риски могут включать финансовую неопределенность, юридические обязательства, ошибки стратегического управления, аварии и стихийные бедствия.
«Катастрофы никогда не исчезнут», — сказал Эндерле. «Эти системы слишком сложны и слишком привлекательны, чтобы полностью исключить риск».