Вопросы по теме 'prometheus-alertmanager'
Prometheus Alertmanager Отключение предупреждений через пользовательский интерфейс не предотвращает срабатывание первого предупреждения
Можно ли использовать функцию «Без звука» в пользовательском интерфейсе Alertmanager, чтобы отключить новые оповещения до их отправки получателю? Это было бы полезно при выполнении обновления в среде.
Мои оповещения содержат метку «env» (для...
1984 просмотров
schedule
12.11.2022
Оповещение контейнера AlertManager не возвращает имя хоста, на котором оно запущено
Я столкнулся с одной проблемой: я использую правило ниже в файле alert_rules.yml, когда я получаю предупреждение, оно не возвращает имя хоста, на котором работает контейнер. Как я могу вернуть имя хоста вместо идентификатора узла?
Я пробовал с...
1083 просмотров
schedule
13.03.2023
интервал очистки и интервал оценки в прометее
Мой интервал очистки и интервал оценки сильно отличаются друг от друга, как показано ниже (15 с против 4 м). Когда я передаю метрики в конечную точку, я обнаруживаю, что правила оцениваются каждые 4 м, как и ожидалось. Однако я не понимаю, что он не...
13307 просмотров
schedule
05.09.2022
Интеграция оповещений о звонках с Prometheus Alertmanager
Я устанавливаю Prometheus в качестве системы мониторинга с Alertmanager. В качестве оповещения мне нужна услуга, которая позвонит на выбранный номер или группу номеров.
Лучшим решением для нас было бы отсутствие стороннего провайдера, который...
1040 просмотров
schedule
16.03.2022
Как сделать так, чтобы в описании оповещения Прометея указывались как абсолютные, так и абсолютные числа?
В настоящее время у меня есть предупреждение Prometheus, которое срабатывает, когда мой шанс успеха падает ниже 85%.
Я хотел бы добавить к описанию предупреждения абсолютные числа отношения. Как я могу это сделать?
Мой YAML в настоящее время...
699 просмотров
schedule
28.02.2023
Оповещение Прометея о ценностях Нан
Поэтому я создал настраиваемую метрику с помощью сборщика текстовых файлов из экспортера узлов, который проверяет размер базы данных и, если эта резервная копия базы данных за текущий день не найдена, она возвращает Nan в качестве значения. Итак, моя...
458 просмотров
schedule
22.04.2023
Получение оповещений от Alertmanager
У нас есть стандартная структура оповещений в нашей организации: наше приложение подключено к Prometheus, а оповещения получаются Alertmanager и отправляются нашей команде в Slack. Мы разделили наши оповещения на мелкие и крупные. Я пытаюсь найти...
222 просмотров
schedule
10.07.2023
Prometheus Alert Manager для Федерации
У нас есть несколько кластеров, на которых работают наши приложения. Мы хотели бы создать кластер центрального мониторинга, который может извлекать метрики из остальной части кластера с помощью Prometheus Federation.
Итак, для этого мне нужно...
1261 просмотров
schedule
15.06.2022
Prometheus предупреждает о значении ниже порогового значения
Мы используем предупреждение Prometheus (и узел-экспортер), чтобы проверить, не заканчивается ли у нас память на узле.
Проблема: во многих случаях я получаю предупреждение со значением $, которое ниже порогового значения в выражении.
Выражение:...
437 просмотров
schedule
06.04.2022
оповещение об отсутствии метрики для многих хостов в alertmanager
У меня много серверов, которые контролируются с помощью Prometheus, у каждого хоста одинаковые показатели.
Мне нужно правило оповещения, которое предупреждает, когда конкретная метрика (например, some_metrics ) отсутствует на определенном хосте...
914 просмотров
schedule
27.10.2022
Как отправлять оповещения о каждой ошибке в моих журналах с помощью Promtail / Loki - AlertManager?
Я использую Promtail + Loki для сбора журналов, и я не могу понять, как я могу предупреждать о каждой ошибке в моих файлах журналов. Я также использую Prometheus, Alertmanager и Grafana. Я видел, как некоторым людям это удавалось, но никто из них...
3365 просмотров
schedule
10.06.2022
Как разделить 2 метрики в Prometheus PromQL
Я создаю свою панель инструментов в Graphana, используя Prometheus. У меня есть 2 показателя (общее количество обращений к сервису и общее количество ошибок тайм-аута)
1 - это общее количество обращений к сервису PromQL- (увеличение...
413 просмотров
schedule
27.05.2022
не предупреждать с помощью prometheus / alertmanager в определенное время (окно обслуживания), если машина выходит из строя
У меня есть машина ec2, на которой у меня установлено оповещение (если оно выходит из строя) с использованием тегов promethues / alertmanager. Техническое обслуживание этой машины запланировано на 6 утра два раза в неделю.
Я не хочу получать...
659 просмотров
schedule
03.10.2022
Отладка веб-перехватчика alertmanager
Я использую приложение для мониторинга, предоставленное ранчером 2.5, которое практически устанавливает Helm-диаграмму kube-prometheus-stack. Я пытаюсь отправлять оповещения, используя веб-перехватчик в качестве получателя. Веб-перехватчик находится...
261 просмотров
schedule
15.12.2022
Как различать правила предупреждений в Prometheus при наличии нескольких экспортеров
Я хочу контролировать контейнеры докеров, запущенные на нескольких серверах, скажем, у меня есть серверы a, b и контейнеры, работающие внутри них, теперь я добавляю один сервер (d) Я хочу отслеживать все контейнеры докеров внутри всех серверов (A, B)...
30 просмотров
schedule
27.06.2022
Prometheus и Alertmanager - маршрут на основе метки env
Я пытаюсь настроить alertmanager так, чтобы он отправлял оповещения по нужным каналам в зависимости от значения определенной метки. У меня есть 3 резервных канала - dev / staging / prod, и я хочу, чтобы оповещения, поступающие от экземпляров, для...
95 просмотров
schedule
31.05.2023
Есть ли способ уменьшить этот код выражений предупреждений Prometheus? У меня есть несколько похожих выражений, только исходный экземпляр отличается
Предположим, я получаю метрики от службы в теге event_processing_bucket , где экземпляр похож на source = ONE, source = TWO, source = THREE ...... TEN
В настоящее время я использую следующий способ получения предупреждения, но здесь я написал...
22 просмотров
schedule
06.07.2022