Page tree
Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 40 Next »

Успешно сдайте бесплатный сертификационный экзамен в Академии "Инфинет" и получите статус сертифицированного инженера Инфинет.

Пройти сертификационный экзамен

Все инциденты в InfiMONITOR NEXT формируются в соответствии с правилами, в которых описаны условия, при выполнении которых инциденты должны создаваться.

Инциденты

Важность

Важность инцидента помогает сетевым инженерам точно приоритизировать проблемы, выявляемые системой мониторинга в работе беспроводной сети. Чем выше приоритет, тем важнее решение соответствующей проблемы. Всего в InfiMONITOR NEXT предусмотрено 3 уровня важности:

  • Critical - максимальная важность. Инциденты, указывающие на критические проблемы, приводящие к нарушению функционирования беспроводной сети.
  • Warning - средняя важность. Инциденты, указывающие на проблемы, которые не имеют критического влияния на функционирование беспроводной сети, но требующие внимания сетевых инженеров.
  • Notice - низкая важность. Информационные сообщения, требующие внимания сетевых инженеров, но не оказывающие влияния на функционирование беспроводной сети.

Приоритет определяется в правиле формирования инцидента.

Жизненный цикл

Жизненный цикл инцидента включает в себя несколько этапов, описанных в таблице.

ЭтапСтатус инцидентаОписание
ФормированиеНовый
  • Условие возникновения инцидента, указанное в правиле, выполнилось, был создан новый инцидент. Он становится доступным для обработки оператором системы мониторинга.
ОжиданиеНовый

Уже сформированный инцидент может сохранять свой статус при последующих циклах опроса. Это может происходить по следующим причинам:

  • Условие возникновения инцидента, указанное в правиле, выполнилось повторно, но поскольку инцидент уже существует и не был закрыт, то новый инцидент не создается.
  • Условие возникновения инцидента больше не выполнялось, при этом не выполняются одновременно следующие условия:
    • инцидент не был обработан оператором;
    • срок устаревания инцидента еще не наступил;
    • условие автоматического закрытия в соответствующем правиле отсутствует или не выполняется.
ПодтверждениеПодтвержден

Статус устанавливается вручную.

  • Инцидент был обработан оператором системы мониторинга. Если в это время условие возникновения инцидента будет выполняться повторно, то новый инцидент не будет создан.
ЗакрытиеРазрешен
  • Статус устанавливается вручную оператором как подтверждение устранения причины его возникновения.
  • Выполнилось условие автоматического закрытия инцидента соответствующего правила.
УстареваниеУстарел

Статус устанавливается автоматически при одновременном выполнении следующих условий:

  • Условие возникновения инцидента больше не выполняется в течение 72 часов.
  • Инцидент не был вручную закрыт оператором системы мониторинга.
  • Условие автоматического закрытия инцидента отсутствует или его условие не выполняется.

Статусы "Разрешен" и "Устарел" являются конечными и означают, что инцидент был закрыт. Если условия возникновения инцидента снова выполнятся, то будет создан новый инцидент.

Область видимости

Инцидент будет доступен пользователю системы мониторинга только в том случае, если устройство, в отношении которого он возник, находится в области видимости этого пользователя. 

Правила

Структура

Каждое правило имеет следующую структуру:

  • Название - произвольное имя правила.
  • Важность инцидента - важность, которая будет назначена созданному инциденту:
  • Описание - произвольное описание, которое позволит впоследствии быстрее понять суть возникшего инцидента.
  • Группы устройств - группы устройств, в отношении которых будет действовать данное правило.
  • Условия возникновения инцидента.
    • условие срабатывания: одно или несколько условий, объединённых логическими операциями. Условие срабатывание возвращает значения ИСТИНА или ЛОЖЬ;
    • время подтверждения: период времени, в течение которого автоматически выполняется проверка условия срабатывания.

Группы устройств

Каждое правило содержит в себе перечень групп устройств, в отношении которых оно будет действовать. Для настройки используются следующие категории:

  1. Ко всем группам устройств - правило будет действовать в отношении устройств всех групп.
  2. Только к группам - правило будет действовать в отношении устройств выбранных групп.
  3. За исключением групп - правило будет действовать в отношении устройств всех групп, кроме выбранных.

Область действия правила

Условия возникновения инцидента

Каждое условие описывается следующими параметрами:

  1. Оконная функция - применяется к набору значений метрик, полученных в течение указанного временного окна. Например, размер окна составляет 20 минут, в течение которых было выполнено 4 опроса, которые дали следующие результаты: "23, 52, 31, 15, 26". Оконная функция "Max", примененная к этому набору, даст значение "52", "Min" - 15, "All" - "23, 52, 31, 15, 26" и т.д.
  2. Метрика - метрика, значение которой будет использовано в условии.
  3. Оператор - оператор сравнения опорного и фактического значения метрики.
  4. Значение - опорное значение.

Время подтверждения - время, в течение которого выполняется подтверждение выполнения условий срабатывания правила. Если в отношении какого-то устройства выполнились условия правила, то инцидент будет сформирован только в том случае, если условие будет повторно выполняться в течение установленного времени подтверждения - на этом этапе частота опроса соответствющего устройства увеличивается до 1 раза в минуту.

Создание правила

Управление правилами формирования инцидентов осуществляется в разделе "Инциденты".

Переход в раздел управления правилами инцидентов

По умолчанию в InfiMONITOR NEXT добавлены два правила:

  • Host down - инцидент возникнет, если сетевой узел перейдет в статус DOWN.
  • Link down - инцидент возникнет, если беспроводной канал связи перейдет в статус DOWN.

Правила инцидентов по умолчанию

Для создания нового правила нажмите кнопку "Добавить новое правило". В открывшейся форме в соответствии с описанной выше структурой укажите наименование правила, важность инцидента, описание и область действия.

Следующим этапом является определение условий возникновения инцидента. Суть условий заключается в сравнении значения какой-либо метрики, установленного правилом, с фактическим значением, полученным в процессе опроса беспроводного устройства.

Рассмтрим пример, в котором необходимо формировать инциденты в случае, если в течение 5 минут загрузка процессора устройства превышает 75% и объём используемой оперативной памяти составляет не менее 50%. В этом примере условия будут выглядеть следующим образом:

  • Поскольку количество условий в правиле больше одного, то в поне "Необходимо выполнение" нужно установить значение "Всех условий", которое соответствует логическому "И".
  • Для обеих метрик будет применена оконная функция "Max" с размером окна 15 минут, что означает, что в качестве значения метрики будет взято максимальное значение, полученное в течение последних 15 минут.
  • Для метрики "CPU load" используется оператор ">", а для "Memory usage" - ">=".
  • Время подтверждения - 5 минут.

Пример условия возникновения инцидента

Для завершения создания правила нажмите кнопку "Сохранить". Правило начинает действовать при следующем цикле опроса беспроводного устройства.

  • No labels