Я ввожу круглосуточный мониторинг наших систем. Чтобы избежать ненужных страниц посреди ночи, я хочу, чтобы Nagios НЕ выдавал мне пейджинг, если только одна или две проверки службы не пройдены, так как это не окажет никакого влияния на пользователей: на других серверах работает та же служба, и влияние на пользователях практически нулевой, так что исправление проблемы есть время до следующего дня.
Но: я хочу получать сообщения, если слишком много проверок не пройдено.
Например: 50 серверов запускают одну и ту же службу, 2 выходят из строя -> я все еще могу спать. Служба выходит из строя на 15 серверах -> меня выводят на пейджинг, потому что влияние становится слишком высоким.
Что я мог бы сделать, так это добавить много (!) зависимостей уведомлений, которые срабатывают только в том случае, если несколько хостов не работают. Проблема: несмотря на то, что я могу указать, чтобы получать пейджинг, если 15 хостов не работают, мне все равно нужно точно определить, какие хосты должны быть отключены, чтобы это оповещение было отправлено. Я скорее хочу указать, что если ЛЮБЫЕ 15 хостов не работают, создается страница.
Я был бы рад, если бы кто-нибудь помог мне с этим.