Nagios: убедитесь, что запущены службы x из y

Я ввожу круглосуточный мониторинг наших систем. Чтобы избежать ненужных страниц посреди ночи, я хочу, чтобы Nagios НЕ выдавал мне пейджинг, если только одна или две проверки службы не пройдены, так как это не окажет никакого влияния на пользователей: на других серверах работает та же служба, и влияние на пользователях практически нулевой, так что исправление проблемы есть время до следующего дня.

Но: я хочу получать сообщения, если слишком много проверок не пройдено.

Например: 50 серверов запускают одну и ту же службу, 2 выходят из строя -> я все еще могу спать. Служба выходит из строя на 15 серверах -> меня выводят на пейджинг, потому что влияние становится слишком высоким.

Что я мог бы сделать, так это добавить много (!) зависимостей уведомлений, которые срабатывают только в том случае, если несколько хостов не работают. Проблема: несмотря на то, что я могу указать, чтобы получать пейджинг, если 15 хостов не работают, мне все равно нужно точно определить, какие хосты должны быть отключены, чтобы это оповещение было отправлено. Я скорее хочу указать, что если ЛЮБЫЕ 15 хостов не работают, создается страница.

Я был бы рад, если бы кто-нибудь помог мне с этим.


person jcvj    schedule 03.02.2014    source источник


Ответы (1)


Лично я использую Shinken, который имеет бизнес-правила именно для этого. Shinken обратно совместим с Nagios, так что можно легко перенести конфигурацию nagios в shinken.

Кажется, есть аналогичный аддон для nagios аддон Nagios Business Process Intelligence, но у меня нет опыта работы с этим дополнением.

person Vincent    schedule 07.02.2014
comment
Спасибо, Винсент, за то, что поделились своим опытом. Я не могу просто переместить все в Shrinken и Nagios, надстройка Nagios Business Process Intelligence Addon кажется не очень приятной в использовании. Я решил просто написать простой скрипт на питоне, который решит все, что мне нужно, и займет треть времени. Я поделюсь своими мыслями по этому поводу позже здесь. - person jcvj; 07.02.2014