В век глобальной цифровизации трудно представить компанию, не заинтересованную в защите корпоративной информации и отказоустойчивости своих ИТ-систем. Рост объёмов данных и постоянно возрастающая интеграция бизнеса и информационных технологий требуют от последних особой надёжности. Слишком много стоит на кону даже в небольших организациях, где ИТ не является бизнесообразующей сферой.
Но наличие чётко описанного Disaster Recovery плана, с выверенными и постоянно проверяемыми параметрами RTO (Recovery Time Objective) и RPO (Recovery Point Objective), не помогут вовремя среагировать на инцидент без качественно выстроенной системы мониторинга. Согласитесь, неприятно узнать о том, что ваш сервис не функционировал продолжительное время после инцидента, затронувшего его работоспособность. Или, допустим, в начале рабочего дня обнаружить, что система CRM не доступна и сотрудники вынуждены просто ждать, когда она заработает. Сколько стоит час подобного простоя в переводе на чистые деньги с учётом репутационных рисков?
Подобного простоя ресурсов позволяют избежать сервисы мониторинга. Они оперативно оповещают об инцидентах, а также выявляют слабые места в системе, что позволяет принять превентивные меры по предотвращению катастрофы. Метрики производительности оптимизируют работу вашего сервиса и помогают выбрать правильное масштабирование (без критических показателей загрузки), а мониторинг hardware-части заблаговременно предупреждает о сбойном модуле, подлежащем замене. Главное — оптимально выстроить такую систему.
Новых уведомлений нет
Классическая схема — установленные на собственной площадке серверы для обеспечения мониторинга. Но часто подобные системы не защищены механизмами отказоустойчивости и находятся в том же месте, где и наблюдаемые ресурсы. В подобной ситуации срабатывает эффект «всех яиц в одной корзине», и при серьёзном инциденте не приходит ни одно уведомление, так как мониторинг умирает вместе с остальной инфраструктурой или теряется канал связи.
Компании помудрее отделяют сервер мониторинга от основной инфраструктуры и ставят на него резервный канал связи — например, gsm-модем, а еще более опытные — внешний скрипт мониторинга за самой системой мониторинга. Самые просветлённые разносят сервис по разным площадкам и настраивают средства обеспечения отказоустойчивости.
Но случается, что неверно настроенный мониторинг является номинальным и не используется по назначению. Метрики не корректируются, ключевые сервисы не выделяются или выделяются неправильно, многие критические компоненты вообще забыты, а в почту одного или двух «ответственных» людям начинают сыпаться тонны «спама», за которым трудно разглядеть действительно важную информацию. Поначалу этот завал пытаются разгребать, корректируют параметры серверов (обычно вслепую), но затем другие потоки задач отодвигают корректировку сервисов мониторинга на второй план. И тут случается беда. Знакомо?
Направо пойдёшь…
Из данного положения есть несколько выходов. Например, нанять высококвалифицированного специалиста или аутсорс-команду для выстраивания корректной схемы наблюдения за ресурсами компании. Но полученное решение надо кому-то поддерживать, иначе оно со временем потеряет актуальность и превратится в мертвый груз. К тому же данный вариант довольно дорог.
Кроме того, всегда можно организовать систему мониторинга собственными силами. На рынке достаточно продуманных систем — как платных, так и из области open-source-проектов. Первые потребуют финансовых вложений, вторые — серьёзной компетенции для построения со стороны ИТ-отдела. В итоге вы платите либо за продукт, либо за специалиста, который становится в этой системе «узким горлышком», если нет второго такого же специалиста на подмену в его отсутствие.
Продуманная схема мониторинга должна обладать несколькими качествами:
- учитывать все необходимые для мониторинга элементы;
- правильно расставлять приоритеты;
- быть отказоустойчивой;
- быть распределённой на случай отказов;
- являться поддерживаемой 24/7/365;
- стоить недорого.
Мониторинг-как-сервис
Под вышеописанные критерии отлично подходит ставшая популярной услуга Monitoring-as-a-Service (MAAS), последнее время всё чаще предлагаемая сервис-провайдерами. Правда, многие современные компании пытаются строить in-house-решения, затрачивая на это существенные ресурсы, набивая шишки и теряя время и, в конечном итоге, деньги, вместо того, чтобы обратиться к команде профессионалов с огромным опытом и высоким уровнем компетенции в данных вопросах.
Профессиональные системы и их интеграция стоят серьёзных денег, но когда мониторинг становится сервисом для конечного потребителя, это перестаёт быть проблемой — всю нагрузку забирает на себя сервис-провайдер. Это справедливо и для вопросов профессиональной компетенции, которая всегда поддерживается поставщиком услуг в актуальном состоянии.
При использовании модели MAAS можно получать не только своевременное оповещение о случившихся инцидентах, но и профессиональные советы с указанием зон роста ваших систем. Так как команда сервис-провайдера включает в себя специалистов различных профилей, покрывающих практически все области информационных технологий, то в короткие сроки можно получить аудит всех информационных систем с планом устранения проблемных участков.
Отказоустойчивость мониторинга при сервисной модели также лежит в плоскости ответственности сервис-провайдера и обычно реализуется децентрализованностью системы или резервированием схемы на несколько ЦОД. Плюс заказчик получает гарантированную реакцию на инцидент в рамках 24/7/365, что не всегда удаётся реализовать собственными силами.
Услуга Monitoring-as-a-Service обойдётся конечному пользователю гораздо дешевле, чем совокупная стоимость самостоятельного построения и поддержки системы мониторинга подобного уровня. И позволит вместо того, чтобы беспокоиться о потенциальных проблемах информационной экосистемы компании, сосредоточить внутренние ресурсы на реализацию основной бизнес-стратегии.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.