Резюме

Термин «наблюдаемость» быстро приближается к пику ажиотажа, но он имеет решающее значение для управления облачными архитектурами на любом современном предприятии. В этом кратком обзоре мы излагаем нашу позицию относительно эволюции Observability в ИТ-операциях и подчеркиваем потенциал использования машинного обучения и искусственного интеллекта, чтобы сделать Observability более полезным в контексте распределенных сред. Мы также выделим некоторые соображения для организаций, изучающих использование машинного обучения (ML) или искусственного интеллекта (AI) для управления данными Observability.

Введение

Термин «наблюдаемость» сегодня очень популярен среди ИТ-операторов, SRE и DevOps, но в умах лиц, принимающих современные ИТ-решения, также присутствует некоторая путаница в отношении того, как он вписывается в их стратегию. Такие вопросы, как Мониторинг++, помогает ли он в безопасности и т. д.? Это краткое исследование предназначено для того, чтобы ответить на основные вопросы, возникающие у современных лиц, принимающих решения, в отношении наблюдаемости, а также изложить зарождающийся, но развивающийся ландшафт.

Начнем с определения термина Википедия.

В теории управления наблюдаемость — это мера того, насколько хорошо внутренние состояния системы могут быть выведены из знания ее внешних выходных данных. Наблюдаемость и управляемость системы математически двойственны. Концепция наблюдаемости была введена венгерско-американским инженером Рудольфом Э. Кальманом для линейных динамических систем.

Несмотря на то, что он не переводится напрямую на то, как этот термин используется в контексте современных корпоративных ИТ, он предлагает частичное определение наблюдаемости. Наблюдаемость — это знание внутренних состояний (распределенной) системы через знание внешних выходов. Знание внутренних состояний высокораспределенной системы имеет решающее значение, и единственный способ, с помощью которого ИТ-операторы могут сделать вывод об этом, — это доступные извне знания, включая данные мониторинга, данные журналов, данные трассировки и т. д.

Наш взгляд на то, что представляет собой наблюдаемость, совпадает с оригинальным сообщением в блоге Twitter по этой теме.

  • Мониторинг
  • Оповещение/визуализация
  • Инфраструктура трассировки распределенных систем
  • Агрегация/аналитика журналов

Очевидно, что это выходит далеко за рамки мониторинга и меняет традиционный подход к ИТ-операциям.

Читать полный отчет здесь.