Вопросы по теме 'prometheus-alertmanager'

Prometheus Alertmanager Отключение предупреждений через пользовательский интерфейс не предотвращает срабатывание первого предупреждения
Можно ли использовать функцию «Без звука» в пользовательском интерфейсе Alertmanager, чтобы отключить новые оповещения до их отправки получателю? Это было бы полезно при выполнении обновления в среде. Мои оповещения содержат метку «env» (для...
1984 просмотров
schedule 12.11.2022

Оповещение контейнера AlertManager не возвращает имя хоста, на котором оно запущено
Я столкнулся с одной проблемой: я использую правило ниже в файле alert_rules.yml, когда я получаю предупреждение, оно не возвращает имя хоста, на котором работает контейнер. Как я могу вернуть имя хоста вместо идентификатора узла? Я пробовал с...
1083 просмотров

интервал очистки и интервал оценки в прометее
Мой интервал очистки и интервал оценки сильно отличаются друг от друга, как показано ниже (15 с против 4 м). Когда я передаю метрики в конечную точку, я обнаруживаю, что правила оцениваются каждые 4 м, как и ожидалось. Однако я не понимаю, что он не...
13307 просмотров
schedule 05.09.2022

Интеграция оповещений о звонках с Prometheus Alertmanager
Я устанавливаю Prometheus в качестве системы мониторинга с Alertmanager. В качестве оповещения мне нужна услуга, которая позвонит на выбранный номер или группу номеров. Лучшим решением для нас было бы отсутствие стороннего провайдера, который...
1040 просмотров
schedule 16.03.2022

Как сделать так, чтобы в описании оповещения Прометея указывались как абсолютные, так и абсолютные числа?
В настоящее время у меня есть предупреждение Prometheus, которое срабатывает, когда мой шанс успеха падает ниже 85%. Я хотел бы добавить к описанию предупреждения абсолютные числа отношения. Как я могу это сделать? Мой YAML в настоящее время...
699 просмотров

Оповещение Прометея о ценностях Нан
Поэтому я создал настраиваемую метрику с помощью сборщика текстовых файлов из экспортера узлов, который проверяет размер базы данных и, если эта резервная копия базы данных за текущий день не найдена, она возвращает Nan в качестве значения. Итак, моя...
458 просмотров
schedule 22.04.2023

Получение оповещений от Alertmanager
У нас есть стандартная структура оповещений в нашей организации: наше приложение подключено к Prometheus, а оповещения получаются Alertmanager и отправляются нашей команде в Slack. Мы разделили наши оповещения на мелкие и крупные. Я пытаюсь найти...
222 просмотров
schedule 10.07.2023

Prometheus Alert Manager для Федерации
У нас есть несколько кластеров, на которых работают наши приложения. Мы хотели бы создать кластер центрального мониторинга, который может извлекать метрики из остальной части кластера с помощью Prometheus Federation. Итак, для этого мне нужно...
1261 просмотров

Prometheus предупреждает о значении ниже порогового значения
Мы используем предупреждение Prometheus (и узел-экспортер), чтобы проверить, не заканчивается ли у нас память на узле. Проблема: во многих случаях я получаю предупреждение со значением $, которое ниже порогового значения в выражении. Выражение:...
437 просмотров
schedule 06.04.2022

оповещение об отсутствии метрики для многих хостов в alertmanager
У меня много серверов, которые контролируются с помощью Prometheus, у каждого хоста одинаковые показатели. Мне нужно правило оповещения, которое предупреждает, когда конкретная метрика (например, some_metrics ) отсутствует на определенном хосте...
914 просмотров
schedule 27.10.2022

Как отправлять оповещения о каждой ошибке в моих журналах с помощью Promtail / Loki - AlertManager?
Я использую Promtail + Loki для сбора журналов, и я не могу понять, как я могу предупреждать о каждой ошибке в моих файлах журналов. Я также использую Prometheus, Alertmanager и Grafana. Я видел, как некоторым людям это удавалось, но никто из них...
3365 просмотров

Как разделить 2 метрики в Prometheus PromQL
Я создаю свою панель инструментов в Graphana, используя Prometheus. У меня есть 2 показателя (общее количество обращений к сервису и общее количество ошибок тайм-аута) 1 - это общее количество обращений к сервису PromQL- (увеличение...
413 просмотров

не предупреждать с помощью prometheus / alertmanager в определенное время (окно обслуживания), если машина выходит из строя
У меня есть машина ec2, на которой у меня установлено оповещение (если оно выходит из строя) с использованием тегов promethues / alertmanager. Техническое обслуживание этой машины запланировано на 6 утра два раза в неделю. Я не хочу получать...
659 просмотров

Отладка веб-перехватчика alertmanager
Я использую приложение для мониторинга, предоставленное ранчером 2.5, которое практически устанавливает Helm-диаграмму kube-prometheus-stack. Я пытаюсь отправлять оповещения, используя веб-перехватчик в качестве получателя. Веб-перехватчик находится...
261 просмотров

Как различать правила предупреждений в Prometheus при наличии нескольких экспортеров
Я хочу контролировать контейнеры докеров, запущенные на нескольких серверах, скажем, у меня есть серверы a, b и контейнеры, работающие внутри них, теперь я добавляю один сервер (d) Я хочу отслеживать все контейнеры докеров внутри всех серверов (A, B)...
30 просмотров

Prometheus и Alertmanager - маршрут на основе метки env
Я пытаюсь настроить alertmanager так, чтобы он отправлял оповещения по нужным каналам в зависимости от значения определенной метки. У меня есть 3 резервных канала - dev / staging / prod, и я хочу, чтобы оповещения, поступающие от экземпляров, для...
95 просмотров

Есть ли способ уменьшить этот код выражений предупреждений Prometheus? У меня есть несколько похожих выражений, только исходный экземпляр отличается
Предположим, я получаю метрики от службы в теге event_processing_bucket , где экземпляр похож на source = ONE, source = TWO, source = THREE ...... TEN В настоящее время я использую следующий способ получения предупреждения, но здесь я написал...
22 просмотров
schedule 06.07.2022