Amazon CloudWatch
Amazon CloudWatch – это сервис мониторинга и наблюдения для инженеров DevOps, разработчиков, инженеров по надежности сайтов и ИТ-менеджеров. CloudWatch предоставляет данные и действенные аналитические сведения для мониторинга приложений, реагирования на изменения производительности в масштабах системы, оптимизации использования ресурсов и получения единого представления о работоспособности системы. CloudWatch собирает данные мониторинга и операционные данные в виде журналов, метрик и событий, помогая получить единое представление приложений, сервисов и ресурсов AWS, работающих на платформе AWS, а также в локальной среде. С помощью CloudWatch вы можете обнаруживать аномальное поведение в своих средах, настраивать предупреждения, создавать общие визуальные представления журналов и метрик, выполнять автоматизированные действия, устранять неполадки, а также узнавать полезные сведения, которые помогут вам поддерживать стабильную
работу приложений.
Преимущества
Наблюдение за всеми приложениями и инфраструктурой на единой платформе
Современные приложения (например, работающие в микросервисных архитектурах) создают большие объемы данных в виде метрик, журналов и событий. Amazon CloudWatch дает возможность собирать, просматривать и сопоставлять эти данные, используя единую платформу для всех ресурсов, приложений и сервисов AWS, которые работают на платформе AWS и локальных серверах. Это помогает классифицировать разрозненные хранилища данных, чтобы легко получить представление о всей системе и быстро устранить проблемы.
Самый простой способ сбора метрик в локальной среде и облаке AWS
CloudWatch упрощает мониторинг ресурсов и приложений AWS. Этот сервис естественно интегрируется с более чем 70 сервисами AWS (например, Amazon EC2, Amazon DynamoDB, Amazon S3, Amazon ECS, Amazon EKS и AWS Lambda) и автоматически публикует подробные ежеминутные метрики и пользовательские метрики с посекундной детализацией, чтобы вы могли углубиться в подробности журналов для получения дополнительного контекста. Вы также можете использовать CloudWatch в гибридных облачных архитектурах, применяя агент или API CloudWatch для мониторинга локальных ресурсов.
Повышение эксплуатационных показателей и оптимизация использования ресурсов
С помощью Amazon CloudWatch можно настраивать предупреждения и автоматизировать действия, используя предварительно определенные пороговые значения или алгоритмы машинного обучения, выявляющие аномальное поведение по метрикам. Например, можно автоматически запускать Amazon EC2 Auto Scaling или останавливать инстансы с целью сокращения избыточных расходов. Вы также можете использовать CloudWatch Events в бессерверных средах, чтобы активировать рабочие процессы с использованием таких сервисов, как AWS Lambda, Amazon SNS и AWS CloudFormation.
Операционный контроль и аналитика
Для оптимизации производительности и использования ресурсов необходимы единое операционное представление, обновляемые в реальном времени подробные данные и журнал. CloudWatch предоставляет автоматические панели управления и данные с посекундной детализацией, а также обеспечивает хранение метрик сроком до 15 месяцев. Вы также можете выполнять математические операции с метриками для получения аналитических сведений о работе и эксплуатации. Например, можно агрегировать данные об использовании для всего парка инстансов EC2.
Получение полезной аналитической информации из журналов
CloudWatch позволяет просматривать, анализировать и визуализировать журналы, чтобы без труда устранять неисправности. Используя сервис CloudWatch Logs Insights, вы платите только за выполненные запросы. Он масштабируется с учетом объема журнала и сложности запросов, выдавая ответы за считанные секунды. Кроме того, вы можете публиковать основанные на журналах метрики, создавать предупреждения, а также сопоставлять журналы и метрики на панелях управления CloudWatch, чтобы получить полное представление об операционных процессах.
Принцип работы
CloudWatch собирает данные мониторинга и операционные данные в виде журналов, метрик и событий, а также визуализирует их с помощью автоматизированных панелей управления, помогая получить единое представление о приложениях, сервисах и ресурсах AWS, работающих на платформе AWS, а также в локальной среде. Вы можете сопоставлять метрики и журналы, чтобы получить более полное представление о работоспособности и эффективности использования ресурсов. Вы также можете создавать предупреждения о превышении указанных пороговых значений метрик или аномальном поведении в метриках, используя алгоритмы машинного обучения. Чтобы обеспечить быстрое реагирование, вы можете настроить автоматические действия, которые будут сообщать вам о возникающих предупреждениях и позволят сократить среднее время устранения проблем путем, например, запуска автоматического масштабирования. Вы также можете подробно анализировать метрики, журналы и маршруты, чтобы лучше понять, как повысить производительность приложений.

Примеры использования
Мониторинг инфраструктуры и устранение неполадок
Отслеживайте ключевые метрики и журналы, визуализируйте стек приложений и инфраструктуры, создавайте предупреждения, а также сопоставляйте метрики и журналы, чтобы определять и устранять первопричины снижения производительности ресурсов AWS. Например, вы можете наблюдать за экосистемой контейнеров в сервисах Amazon ECS, AWS Fargate, Amazon EKS и Kubernetes.
Сокращение среднего времени устранения проблем
CloudWatch помогает сопоставлять, визуализировать и анализировать метрики и журналы, чтобы вы могли быстро принимать меры для устранения проблем, а также совмещать эти данные с данными трассировки из AWS X-Ray для обеспечения комплексного наблюдения. Вы также можете анализировать запросы пользователей, чтобы ускорить устранение неполадок и отладку, а также сократить среднее время устранения проблем (MTTR).
Проактивная оптимизация ресурсов
Предупреждения CloudWatch сравнивают значения метрик с пороговыми значениями, заданными вами или определенными сервисом CloudWatch, при помощи моделей машинного обучения, чтобы выявлять аномальное поведение. В случае срабатывания предупреждения CloudWatch может автоматически принять меры для автоматизации планирования мощности и ресурсов. Например, включить Amazon EC2 Auto Scaling или остановить инстанс.
Мониторинг приложений
Наблюдайте за приложениями, работающими на платформе AWS (в Amazon EC2, контейнерах и бессерверных средах) или в локальной среде. CloudWatch собирает данные на каждом уровне стека производительности, включая метрики и журналы на автоматических панелях управления.
Анализ журналов
Изучайте, анализируйте и визуализируйте журналы, чтобы устранять неполадки и повышать производительность приложений. Вы можете выполнять запросы, помогающие быстро и эффективно реагировать на неполадки. Если возникнет проблема, вы можете сразу приступить к отправке запросов на специальном языке для быстрого выявления возможных причин.
«Мы используем архитектуру на основе микросервисов. Сервис Amazon CloudWatch стал мгновенным решением, так как он не нуждается в настройке и обслуживании инфраструктуры. CloudWatch без проблем справляется с задачами нашего масштаба и избавляет от необходимости в интеграции и контроле множества инструментов. Наиболее важным преимуществом для нас является снижение MTTR (среднего времени восстановления), так как наша команда DevOps может быстро выявлять проблемы в инфраструктуре контейнеров»,
– Виталий Гераймович, соучредитель и вице-президент, отдел проектирования, CloudPassage
Клиенты
Клиенты используют Amazon CloudWatch для повышения операционной производительности, оптимизации выделения ресурсов и сокращения MTTR. Дополнительные сведения о том, как организации используют Amazon CloudWatch, см. на нашей странице клиентов.

Mapbox использует Amazon CloudWatch для приема данных из множества источников и отслеживания ключевых рабочих нагрузок.

Pushpay использует Amazon CloudWatch Logs Insights, чтобы отправлять запросы к журналам и снижать эксплуатационную сложность.

Rackspace использует Amazon CloudWatch Agent для мониторинга виртуальных машин.

Благодаря Amazon CloudWatch компании SendGrid не приходится самостоятельно управлять стеком и пользоваться услугами сторонних поставщиков.

CloudPassage использует Amazon CloudWatch для микросервисной архитектуры, чтобы сократить среднее время восстановления.

ConnectWise использует Amazon CloudWatch для мониторинга контейнеров, задержки, запросов веб-серверов и входящих запросов балансировщика нагрузки.
Последние публикации в блогах
В настоящее время нет блогов, посвященных Amazon CloudWatch. Посетите страницу блога AWS.
Джеф Барр
27 ноября 2018 г.
Хелен Лин
15 октября 2018 г.
Создание панели управления Amazon CloudWatch вне Консоли управления AWS
Стивен Маккарри
2 октября 2018 г.
Создание бессерверных конвейеров с использованием Amazon CloudWatch Events
Форрест Бразил
2 мая 2019 г.
Начало работы с AWS

Обучение с помощью 10-минутных учебных пособий
Подробнее об Amazon CloudWatch