Зонтичные системы управления (IBM Netcool / Impact)

Обеспечение заданного уровня качества услуг и высокой доступности оборудования сети являются одними из ключевых задач телекоммуникационного оператора. Быстрое обнаружение неисправностей, эффективный поиск причин и определение приоритетов в их устранении являются критичными для эффективного достижения этой цели.

Автоматизация задач управления событиями (Umbrella Fault Management) в решениях "ЭС ЭНД ТИ УКРАИНА" выполняется на уровнях, которые представлены на рисунке ниже.




Как видно из представленной схемы, можно выделить следующие основные уровни управления событиями:

• Сбор событий (Collection) и их консолидация и нормализация (Consolidation);
• Автоматизация обработки событий (Automation);
• Представление информации (Inform), включая управление оповещениями (Alert Management)

На уровне сбора и консолидации cобытий специальные программные модули Netcool probes (можно использовать термины «коннектор», «медиатор», «адаптер») получают "сырые" данные из EMS / NMS (Element / Network Management System) по протоколу, который поддерживает эта система управления: CORBA, SNMP, Q3, ….

Полученные от систем управления события консолидируются, приводятся к единому виду (нормализуются), обрабатываются в реальном времени и сохраняются в отдельной базе данных для отчетов, выяснения причин аварийных ситуаций, а также для детального анализа параметров качества сети, которые связаны с доступностью.

Консолидация позволяет видеть состояние сети через единую консоль, а не разрозненными фрагментами в разных приложениях и системах.

Ключевые результаты, которые заказчики получают от использования системы управления событиями и неисправностями на уровне сбора и консолидации:

• События доступны через «единое окно» - нет необходимости привлечения к анализу десятков различных систем управления;
• Уменьшение числа событий путем использования базовых корреляций: deduplication и problem/ resolution.
• «Summary» события приводится к виду, который дает понимание аварийной ситуации с первого взгляда;
• Соглашение о наименованиях оборудования (naming convention);
• События доступны не только инженерам NOC, но и другим инженерам, которые отвечают за эксплуатацию сети, а также субподрядчикам;
• В разных системах управления могут использоваться разные подходы к управлению жизненным циклом события – они приводятся к единому;
• Получение отчетов по событиям на оборудовании за выбранный период.

Здесь хочется подчеркнуть, что по опыту общения с операторами связи центральной и восточной Европы, Азии, многие из них при внедрении системы Umbrella Fault Management останавливаются на уровне сбора и консолидации данных. С нашей точки зрения, отсутствие автоматической обработки поступающих данных значительно ограничивает возможности системы. Именно уровень автоматизации обработки событий дает наибольший эффект.

Ключевые результаты, которые заказчики получают от использования системы управления событиями и неисправностями на уровне автоматизации:

1. Категоризация событий по степени влияния на сервисы:
• События, которые влияют на сервисы, предоставляемые заказчикам;
• События, которые в данный момент не влияют на сервисы, но развитие ситуации может привести к влиянию;
• События, которые не влияют и не приведут к влиянию на сервис;
2. Определение приоритета аварии (за какое время нужно восстановить сервис);
3. Анализ корневой причины неисправности;
4. Создание и диспетчеризация Trouble Tickets (в том числе и в полностью автоматическом режиме);
5. Восстановление нормальной работы оборудования (сервисов) - Run-book automation.
6. Автоматизация процедуры доступа на площадки (Site Access).

Более подробно примеры сценариев автоматизации задач инженеров изложены в брошюре «Сценарии автоматизации операционных процессов».

Для достижения этих результатов S&T были разработаны собственные модули Correlation Engine и Site Access.

На уровне Inform события предоставляются в виде, удобном для использования инженерами:

• NOC (Network Operations Centre) – в виде списка событий (Event List), статусов базовых станций на карте (GIS) и др.;
• Полевых инженеров – через мобильное приложение OSS Mobile Client.