Управление оповещениями (xMatters)

Поскольку инженеры (если они не сменные) не всегда находятся перед экраном Netcool, задержка с началом диагностики и устранения аварии приводит к увеличению сроков недоступности или уменьшения емкости сети.

В случае, если неисправность вначале не влияла на сервисы, то при несвоевременном ее устранении, развитие аварийной ситуации часто приводит к влиянию на сервисы, которые предоставляются абонентам.





Ручное оповещение об авариях инженеров в их зоне ответственности по телефону, SMS, e-mail является трудоемким и может эффективно работать только для критических аварий для аварий, которые в настоящее время не влияют на сервисы, но потенциально могут привести к нарушению предоставления сервисов.

Автоматизация оповещения с использованием простых скриптов хорошо работает для небольшого количества критических аварий и групп рассылки. Попытка автоматизации оповещения по другим типам аварий с использованием простых скриптов и групп рассылки приводит к тому, что оповещения рассылаются многим инженерам вне зависимости от того поддерживают ли они данную систему в данное время или нет. Со временем такое большого число оповещений персонал начинает игнорировать, что приводит к пропускам своих.

Другое ограничение рассылки оповещений простыми скриптами – сложность организации отслеживания было ли оповещение принято в работу, и, если нет, то – эскалации.

Каким образом решение по управлению оповещениями на основе продуктов xMatters решает эту задачу?


1. Получить событие: используется Correlation Engine для выборки необходимых событий из Netcool в соответствии с их категориями (степенью влияния на сервисы). Интеграционные возможности xMatters обеспечивают возможность вызывать необходимые оповещения из систем Trouble Ticketing и других.

2. Обработать событие:
• Найти человека, которому должно быть доставлено сообщение. Соответствие определяется на основе категории события, роли, ответственности, профиля, месторасположения, доступности и др. критериев.
• Доступность определяется на основе времени суток, графика дежурств, отпуска, замены.
• Сценарий доставки может зависеть от типа оповещения: обязательное или добровольное (по подписке).

3. Сгенерировать оповещение: на основе информации о событии (с учетом канала доставки).

4. Передать оповещение:
• Канал доставки: jabber, SMS, email, голос, клиент для Android и iOS.
• Режим доставки: широковещательный/ последовательный

5. Обработать ответ (для двунаправленного оповещения)
• Подтвердить взятие в работу (acknowledge) – при этом в EventList Netcool в соответствующем поле отобразится имя инженера;
• Отклонить;
• Запустить скрипт, выполняющий определенную команду на устройстве, с которого пришло событие о неисправности.

6. Выполнить эскалацию: отправить уведомление руководителю группы инженеров (при необходимости – повторить эскалацию на вышестоящего руководителя) в случае, если уведомление о неисправности не принято в работу ни одним из инженеров группы за отведенное время.

Использование решения по управлению оповещениями позволяет:
• Минимизировать до 80% число людей, вовлеченных в процесс.
• Сократить начало работ по диагностике или устранению неисправности с 15 – 20 минут (при ручном оповещении), до менее чем 3-х минут (с xMatters).
• Сократить время простоя до 77%.