Критические перебои с серверами обходятся предприятиям в среднем в 300 000 долларов США в час, а во многих случаях превышают 5 миллионов долларов США. Поскольку сетевые требования возрастают, а максимальное время безотказной работы становится необходимостью, крайне важно внедрить надлежащие процессы и системы, чтобы организации постоянно могли смягчать угрозу перебоев.
Множество факторов может привести к простою сети или системы, от проблем с провайдером провайдера до отключения электроэнергии и простых человеческих ошибок. Кроме того, сетевые инфраструктуры становятся все более сложными, и поскольку стеки программного обеспечения нуждаются в более частых обновлениях, они становятся более восприимчивыми к все более эффективным кибератакам, эксплойтам, сбоям и ошибкам.
Дальнейший переход к виртуализации и SD-WAN также является проблемой. Это правда, что эти решения обеспечивают большую гибкость и более эффективные услуги, снижают затраты и могут обеспечивать управление на основе облака, но они также создают точки отказа.
Что, если наложение SD-WAN отключится в уязвимых местах, таких как соединение последней мили? Обновления прошивки идут не так? Или же нарушение безопасности происходит в слепой зоне видимости?
Все это равносильно увеличению вероятности простоя, который может быстро привести к катастрофе для бренда, повлиять на доходы и нанести ущерб способности организации предоставлять услуги. Чтобы помочь избежать и смягчить последствия простоя, как сейчас, так и в будущем, вот несколько важных советов.
Содержание статьи
Различение устойчивости и избыточности
Если вы хотите разработать бизнес-план, чтобы ограничить вероятность простоя и смягчить последствия проблемы, если она возникает, с чего начать? Для начала важно рассмотреть сбои с двух разных точек зрения: операционная сеть и поддерживающая ее физическая инфраструктура.
Для физической инфраструктуры организации должны учитывать аппаратные компоненты сети, такие как системы питания и охлаждения. Чтобы обеспечить исправность и работоспособность систем, многие крупные центры обработки данных будут иметь избыточные компоненты, такие как резервные генераторы, резервные источники питания и источники бесперебойного питания.
Избыточность также важна для ИТ. У организаций есть много вариантов для внедрения правильной экосистемы для своих нужд. Например, компания может выбрать размещение и запуск приложений в нескольких местах и внедрить виртуализацию, чтобы добавить элементы, обеспечивающие плавную передачу нагрузки.
Кроме того, организации, возможно, потребуется разрешить предприятию мигрировать в другое место, например, во второй центр обработки данных, сайт-колокейшн или гибридную облачную среду, в случае критического сбоя.
Несмотря на то, что отказоустойчивая сеть может содержать некоторую избыточность, избыточная система не обязательно достаточно устойчива, чтобы обеспечить непрерывность бизнеса. Поэтому для бизнеса очень важно уметь различать просто внедрение избыточности сети и обеспечение устойчивости сети для мониторинга и поддержания работоспособности основных «магистральных» и критически важных сетей даже в современных сложных и сложных виртуализированных средах.
Если произошел сбой первичной сети или что-то пошло не так с другим оборудованием, кроме избыточных элементов, сеть может остаться неработоспособной.
Во многих случаях простое добавление большего количества маршрутизаторов или коммутаторов не повысит безопасность сети. Представьте, что инженер перерезает кабель — сеть может выйти из строя независимо от того, сколько установлено дублированного оборудования.
Кроме того, капитальные затраты и затраты на эксплуатацию и техническое обслуживание, связанные с избыточностью вне центра обработки данных, часто могут сделать его дорогостоящим, поэтому многие компании предпочитают не тратить значительные суммы на подключения к данным и оборудование для резервного копирования, которые, вероятно, большую часть времени будут простаивать.
Если организация действительно ценит максимальное время безотказной работы сети, она должна выходить за рамки избыточного оборудования. Вот где так важна стратегия сквозной устойчивости. Устойчивость заключается в быстром восстановлении, чтобы обеспечить нормальную работу организации вскоре после сбоя в сети, и этого часто можно достичь путем реализации альтернативного пути, такого как сотовая сеть, к устройствам, расположенным на удаленных узлах, когда основная сеть не работает.
Перспективная проверка для Edge
Исторически многие предприятия сосредоточились на использовании больших центров обработки данных или облачных сред в основе своей деятельности. Однако времена меняются, и потребность в инфраструктуре, более близкой к пользователю (вызванной новыми приложениями, интенсивно использующими данные), бросает вызов традиционным облачным вычислениям для доставки ИТ в таких вопросах, как производительность, безопасность данных и эксплуатационные расходы. Это заставляет многие сети переходить на передний план для более быстрой скорости доставки, снижения затрат и повышения масштабируемости.
Хотя периферийные вычисления предоставляют много преимуществ, они также обеспечивают сложную экосистему для защиты. Например, уровень устойчивости и избыточности, на который полагаются организации и их клиенты, труднее поддерживать на грани.
В этой среде перебои в работе сети могут стать более распространенными, и после них может стать труднее восстанавливаться. Итак, что могут сделать организации, чтобы подготовиться к этому и подготовить свою сеть к будущему? Первым шагом может стать рассмотрение сетевой инфраструктуры с комплексной точки зрения.
Чтобы начать работу по созданию инфраструктуры, ориентированной на будущее, организация должна начать с того, чтобы рассчитывать на ожидания клиентов в отношении высокого уровня безотказной работы и устойчивости. Они должны опираться на этот момент при рассмотрении вопроса о том, как развернуть свою сеть, системы, архитектуру, резервирование и устойчивость, которые им необходимо создать.
Инструменты, необходимые для обеспечения устойчивости
Для удовлетворения потребностей клиентов инструменты, обеспечивающие устойчивость сети, будут иметь решающее значение для успеха. Здесь следует учитывать одну вещь: настоящая устойчивость сети не может быть достигнута путем обеспечения устойчивости к одному отдельному элементу оборудования, будь то основной коммутатор или маршрутизатор.
Вместо этого важно, чтобы любое решение для обеспечения устойчивости могло подключаться ко всему оборудованию на периферийном узле или в центре обработки данных, составлять карту того, что там есть, и устанавливать то, что находится в автономном режиме и в сети в любое время.
Одним из приоритетов должно быть обеспечение того, чтобы бизнес был наглядным и имел возможность развернуться, если проблемы все же возникнут. Рассмотрим крупное финансовое или медицинское предприятие с сетевым операционным центром, для которого может потребоваться постоянное время безотказной работы приложений и обслуживания клиентов. У них может быть несколько филиалов по всему миру с сопутствующими проблемами часового пояса.
В результате они могут изо всех сил пытаться понять, что сбой даже произошел, потому что они не уведомляются заранее, если что-то отключается. Даже когда они знают, может быть трудно понять, какое оборудование в каком месте имеет проблему, если на месте никто не смотрит физически.
Для устранения ошибок организации может потребоваться выполнить быструю перезагрузку системы удаленно. Если это не работает, возможно, проблема с обновлением программного обеспечения. Эта проблема может быть решена путем использования новейших интеллектуальных внеполосных (OOB) систем управления. Образ основного оборудования и его конфигурации — например, маршрутизатор или коммутатор — можно сохранить, а устройство можно быстро перенастроить удаленно, без необходимости отправки инженера на место.
Если бы произошел сбой, можно было бы обеспечить отказоустойчивость сети посредством переключения на сотовую связь. Это позволило бы поддерживать работоспособность предприятия, пока исходная ошибка устранялась удаленно, даже когда основная сеть не работала.
Хотя включение дополнительной устойчивости с помощью OOB стоит денег, рентабельность инвестиций может превышать затраты. Этот альтернативный путь доступа может использоваться организацией нечасто. Однако, когда это требуется, это становится критическим фактором успеха.
Также стоит учитывать, что устойчивость обычно намного дешевле, чем покупка большого количества избыточного оборудования. Это становится все более актуальным по мере увеличения числа периферийных местоположений. Хотя для организации может оказаться целесообразным приобрести избыточность в центральном центре обработки данных, такая же избыточность не может быть встроена в каждый шкаф для хранения данных или стойку в небольшом удаленном месте.
Помимо обеспечения надежного решения для резервного копирования с такими инструментами, как интеллектуальное управление OOB и аварийное переключение на сотовую связь, организации могут обеспечить дополнительную защиту и добиться экономии средств, размещая такие инструменты, как автоматизация NetOps, поверх решений для безопасной удаленной инициализации. Это может устранить множество повторяющихся задач, устранить вероятность человеческих ошибок и высвободить время.
Рассмотрим клиента
Организации и их руководство должны учитывать опыт клиентов, который они предоставляют на самом краю, и обеспечивать, чтобы их системы могли обеспечить его на постоянной основе. В противном случае они рискуют простоем и некачественным обслуживанием.
Если проблема все-таки возникает, для бизнеса жизненно важно четко сообщать, когда возникают проблемы. Наличие всесторонней видимости и гибких вариантов отработки отказа играет важную роль в быстром информировании клиентов о том, что произошло, и о том, как исправить ситуацию.
К сожалению, перебои в сети — это проблема, с которой сталкивается каждая организация. Трудно полностью предотвратить простои. Тем не менее, различные интеллектуальные инструменты, такие как системы управления OOB, аварийное переключение на сотовую связь и автоматизация NetOps, могут помочь с существенными преимуществами — от ресурсоэффективного удаленного мониторинга и управления до непрерывного подключения к Интернету в случае возникновения проблем с интернет-провайдером или физической неполадки.
Внедрение правильных процессов и систем для обеспечения устойчивости сети имеет важное значение, поэтому предприятия могут значительно снизить угрозу сбоев. Это помогает устранить такие проблемы, как потеря критических систем или взрывы в социальных сетях от недовольных клиентов, что может оказать существенное влияние на итоги бизнеса.
Таким образом, реализация программы обеспечения устойчивости сети — это не просто роскошь для крупных корпораций, но фактически предотвращение потерь 101.