Мониторинг CloudWatch так же, как вы обнаружили. Вы сможете сделать вывод о том, что один из ваших экземпляров заморожен, взглянув на метрики, но CloudWatch, например, этого не сделает. отправить вам электронное письмо, например, когда ваше приложение не работает или работает слишком медленно.
Если вы ищете какое-то уведомление, когда ваше приложение или экземпляр не работают, я предлагаю вам использовать службу мониторинга. Pingdom — хороший вариант. Вы также можете настроить новый экземпляр на AWS и установить инструмент мониторинга, например Nagios, который я предпочитаю. вариант.
Передовой опыт, который всегда полезен в долгой дороге: использование балансировки нагрузки (Amazon ELB), более один экземпляр, на котором запущено ваше приложение, автомасштабирование (когда экземпляр не работает, Amazon автоматически запустит новый и будет поддерживать ваше соглашение об уровне обслуживания) и настраиваемый мониторинг.
Моя команда долгое время использовала собственный скрипт мониторинга, и мы всегда знали о сбоях, как только они происходили. По сути, если бы у нас было два узла, на которых работало наше приложение, узел 1 отправлял HTTP-запросы узлу 2, а узел 2 — узлу 1. Если какой-либо запрос занимал больше, чем ожидалось, или возвращал неожиданный статус HTTP или тело ответа, сценарий отправлял электронное письмо на узел 2. системные администраторы. В настоящее время мы полагаемся на более надежные подходы, такие как Nagios, который может даже отслеживать содержимое операционной системы (потоки и т. д.), серверы приложений (состояние пулов соединений и т. д.) и так далее. Это стоит каждого цента, вложенного в его настройку.
person
Viccari
schedule
18.02.2012