Возможности Amazon CloudWatch

Обзор

Amazon CloudWatch – это сервис мониторинга и управления, который предоставляет ценные с практической точки зрения данные об AWS, гибридных, локальных и других облачных приложениях, а также ресурсах инфраструктуры. Вы можете собирать и просматривать операционные данные и данные о производительности в виде журналов и метрик на одной платформе, а не в отдельных хранилищах таких данных (на серверах, в сети или в базе данных). С помощью CloudWatch можно отслеживать полный стек (приложения, инфраструктуру, сеть и сервисы) и использовать предупреждения, журналы и события для автоматизации действий в целях сокращения среднего времени устранения проблем (MTTR). Это позволяет освободить важные ресурсы, чтобы сосредоточиться на создании приложений и повышении коммерческой ценности.

CloudWatch предоставляет полезную информацию, которая позволяет оптимизировать производительность приложений, управлять использованием ресурсов и оценивать работоспособность системы в целом. CloudWatch обновляет метрики и данные журналов с интервалом в одну секунду, обеспечивает хранение данных (метрик) в течение 15 месяцев и дает возможность выполнять расчеты с использованием метрик. Это позволяет анализировать исторические данные для оптимизации затрат и получать интерактивные сведения для оптимизации приложений и ресурсов инфраструктуры. Аналитику контейнеров CloudWatch можно использовать для настройки оповещений, мониторинга контейнерных приложений и микросервисов, а также устранения неполадок в них. CloudWatch собирает, хранит и обобщает данные об использовании процессора, памяти, диска и сети, а также диагностическую информацию, например о сбоях при перезапуске контейнера, чтобы помочь инженерам DevOps находить проблемы и быстро устранять их. Аналитика контейнеров предоставляет аналитику от сервисов управления контейнерами, таких как Amazon ECS для Kubernetes (EKS), Эластичный сервис контейнеров Amazon (ECS), AWS Fargate и автономная платформа Kubernetes (k8s). 

Сбор данных

Сервис Amazon CloudWatch Logs позволяет собирать и хранить журналы ресурсов, приложений и сервисов в режиме, близком к реальному времени. Существуют три основные категории журналов.

1. Предоставленные журналы. Эти журналы автоматически публикуются сервисами AWS от вашего имени. В настоящее время поддерживаются два типа журналов: журналы Amazon VPC Flow Logs и Amazon Route 53.

2. Журналы, публикуемые сервисами AWS. В настоящее время более 30 сервисов AWS публикуют журналы в CloudWatch. В их число входят Amazon API Gateway, AWS Lambda, AWS CloudTrail и многие другие.

3. Пользовательские журналы. Это журналы пользовательских приложений и локальных ресурсов, а также журналы из других облаков.

Можно установить агент CloudWatch с помощью AWS Systems Manager или без труда публиковать журналы с помощью действия API PutLogData.

Amazon CloudWatch позволяет собирать метрики инфраструктуры более чем из 70 сервисов AWS, таких как Amazon Elastic Compute Cloud (Amazon EC2), Amazon DynamoDB, Amazon Simple Storage Service (Amazon S3), Amazon ECS, AWS Lambda и Amazon API Gateway, без каких-либо действий со стороны пользователя. Например, инстансы Amazon EC2 автоматически публикуют метрики загрузки процессора, передачи данных и использования диска, что позволяет отслеживать изменения состояния. Можно использовать встроенные метрики API Gateway для обнаружения задержек или встроенные метрики AWS Lambda для обнаружения ошибок или ограничений. Аналогичным образом, Amazon CloudWatch также позволяет собирать метрики приложений (например, активность пользователя, ошибки или использование памяти) для мониторинга производительности, устранения неполадок и отслеживания тенденций. Можно использовать агент CloudWatch или вызов сервиса API PutMetricData для публикации этих метрик в CloudWatch. Если требуются более подробные метрики, чем стандартные метрики инфраструктуры, например метрики сегментов Amazon Kinesis Data Streams, то можно просто подключить их для каждого ресурса. Аналогичным образом предоставляются метрики приложений с частотой до одного раза в секунду, которые можно использовать для статистики, визуализации и создания предупреждений с высокой степенью детализации.

Сервис Container Insights упрощает сбор и агрегацию специально подобранных метрик и журналов системы контейнеров. Он собирает метрики производительности вычислений, среди которых информация об использовании процессора, памяти, сети и диска. Сервис производит сбор для каждого контейнера в виде событий производительности и автоматически генерирует пользовательские метрики, используемые для мониторинга и предупреждений. События производительности поступают в виде журналов CloudWatch Logs с метаданными о запущенном окружении, такими как идентификатор инстанса Amazon EC2, сервис, точка подключения и идентификатор тома Amazon Elastic Block Store (Amazon EBS). Это упрощает мониторинг и устранение неполадок. Пользовательские метрики CloudWatch автоматически извлекаются из этих журналов, после чего их можно анализировать с помощью языка расширенных запросов CloudWatch Logs Insights. Container Insights также позволяет собирать журналы приложений (stdout / stderr), пользовательские журналы, предопределенные журналы инстанса Amazon EC2, журналы плоскости данных Amazon EKS / k8s и журналы плоскости управления Amazon EKS. Для сбора журналов кластеров Amazon EKS и k8s можно использовать заранее настроенный агент FluentD. Подробнее см. в документации по настройке журналов Container Insights. Для сбора журналов приложений Amazon ECS можно использовать драйвер Журналов Amazon CloudWatch или Fluent Bit.

Аналитика CloudWatch Lambda упрощает сбор и объединение специально подобранных метрик и журналов из функций AWS Lambda. Он собирает метрики производительности вычислений, среди которых информация об использовании ЦПУ, памяти и сети. Сервис производит сбор для каждой функции Lambda в виде событий производительности и автоматически генерирует пользовательские метрики, используемые для мониторинга и предупреждений. События производительности собираются в виде журналов CloudWatch для упрощения мониторинга и устранения неполадок. Пользовательские метрики CloudWatch автоматически извлекаются из этих журналов, после чего их можно анализировать с помощью языка расширенных запросов CloudWatch Logs Insights. Подробнее см. в документации по началу работы с Lambda Insights.

Потоки метрик Amazon CloudWatch позволяют создавать непрерывные потоки метрик в режиме, близком к реальному времени, в выбранное вами местоположение. Это упрощает отправку метрик CloudWatch популярным сторонним поставщикам сервисов с использованием HTTP-адреса Amazon Kinesis Data Firehose. Вы можете создать непрерывный масштабируемый поток, включив в него самые актуальные метрики CloudWatch для работы панелей управления, предупреждений и других инструментов, которые зависят от точных и своевременных метрик. Вы без проблем можете направить метрики в озеро данных на AWS, например на Amazon S3, и начать анализировать использование или производительность с помощью таких инструментов, как Amazon Athena.

Мониторинг

Благодаря наблюдению во множественных аккаунтах в CloudWatch можно контролировать приложения во множественных аккаунтах региона и устранять возникающие в них проблемы. Вы можете искать хранящиеся в них группы журналов из центрального представления, выполнять запросы Logs Insights в различных аккаунтах и создавать правила Contributor Insights для разных аккаунтов, чтобы определить нужное количество участников, создающих наибольшее количество записей журнала. Вы можете визуализировать показатели многих аккаунтов в консолидированном представлении, создавать сигналы тревоги, которые оценивают метрики из других аккаунтов, чтобы узнавать об отклонениях и проблемных тенденциях. Наблюдая за множественными аккаунтами в CloudWatch, можно просматривать интерактивную карту приложений в различных аккаунтах с помощью ServiceLens. Достаточно одного действия, чтобы углубиться в соответствующие метрики, журналы и следы. Наблюдение во множественных аккаунтах в CloudWatch предоставляет целостное отображение рабочих процессов всего за несколько шагов и не требует дополнительных линий передач данных, что позволяет экономить время, силы и сократить затраты на управление инфраструктурой и приложениями.

Панели управления Amazon CloudWatch позволяют создавать пригодные для многократного использования графики и обеспечивают единое представление данных для визуализации облачных ресурсов и приложений. Метрики и данные журналов можно отображать в графическом виде рядом друг с другом на одной панели управления, что позволяет быстро получить необходимые данные и выявить причину проблемы по результатам диагностики. Например, можно визуализировать ключевые метрики, такие как использование процессора и памяти, и сопоставить их с имеющимися ресурсами. Можно связать шаблон журнала с определенной метрикой и настроить предупреждения, чтобы выявлять проблемы с производительностью и операционные неполадки. Это дает общее представление о работоспособности системы и позволяет быстро устранять неполадки, что уменьшает MTTR.

С помощью составных предупреждений Amazon CloudWatch можно комбинировать множество оповещений и снижать уровень помех от них. Если возникшая проблема затрагивает несколько его ресурсов, вы получите одно предупреждение для всего приложения, а не по одному для каждого затронутого ресурса. Это поможет сосредоточиться на поиске первопричины операционных проблем и сократить время простоя приложения. Вы можете указывать общее состояние для группировки таких ресурсов, как приложение, регион AWS или зона доступности.

С помощью предупреждений Amazon CloudWatch можно установить для метрик пороговые значения, по достижении которых будут выполняться определенные действия. Можно создавать высокочастотные предупреждения, устанавливать процентильные пороги и настраивать выполнение какого-либо действия при необходимости. Например, можно создавать предупреждения на основе метрик Amazon EC2, настраивать уведомления и выполнять одно или несколько действий для обнаружения и отключения неиспользуемых или неэффективно используемых инстансов. Предупреждения в режиме реального времени на основе метрик и событий позволяют свести к минимуму время простоя и потенциальное влияние на бизнес.

Приложения и ресурсы инфраструктуры генерируют множество операционных данных и данных мониторинга в виде журналов и метрик. Amazon CloudWatch предоставляет единую платформу для доступа к этим наборам данных и их визуализации, а также позволяет без труда сопоставлять их. Это позволяет быстро выявить основную причину проблемы по результатам диагностики. Можно связать шаблон журнала, например ошибку, с конкретной метрикой и настроить предупреждения, чтобы выявлять проблемы с производительностью и операционные неполадки.

Amazon CloudWatch Application Insights производит автоматизированную настройку возможностей наблюдения для ваших корпоративных приложений, чтобы вы получали сведения об их работоспособности. Это позволяет определить и настроить основные метрики и журналы во всех ваших ресурсах приложения и технологических стеках, т. е. базах данных, веб-серверах (IIS) и серверах приложений, операционной системе, балансировщиках нагрузки и запросах. Сервис непрерывно отслеживает эти телеметрические данные для обнаружения и сопоставления аномалий и ошибок, уведомляя вас о проблемах, возникших в приложении. Чтобы устранять неполадки, он создает автоматизированные панели управления для обнаруженных проблем со связанными метрическими аномалиями и журналами ошибок, а также с дополнительной аналитической информацией об их возможной исходной причине. Это позволяет быстро корректировать работу приложений, обеспечивая их эффективность без влияния на конечных пользователей.

Аналитика контейнеров с улучшенной наблюдаемостью для EKS

Теперь Аналитика контейнеров предоставляет подробные метрики EKS, такие как показатели производительности на уровне контейнера, метрики состояния Kube и метрики плоскости управления EKS, позволяющие визуально детализировать различные уровни контейнеров и легко выявлять такие проблемы, как потеря доступа к памяти в отдельных контейнерах. Также данный сервис показывает список уровней контейнеров, потребляющих большое количество ресурсов, что позволяет выявлять риски в своей среде, даже если вы еще не настроили предупреждения, а также принимать упреждающие меры до того, как это повлияет на работу конечного пользователя. Аналитика контейнеров с улучшенной возможностью наблюдения для Amazon EKS имеет простой интерфейс, позволяющий автоматически настраивать кластеры с помощью дополнения наблюдаемости в CloudWatch для EKS на консоли сведений о кластере и сразу же приступать к обработке данных телеметрии.

Container Insights без улучшенной возможности наблюдения

Аналитика контейнеров CloudWatch собирает, агрегирует и обобщает метрики и журналы ваших контейнерных приложений и микросервисов, работающих на Эластичном сервисе контейнеров Amazon (Amazon ECS) и Эластичном сервисе Amazon Kubernetes (Amazon EKS), а также на платформах Kubernetes в Amazon EC2 и AWS Fargate (как для Amazon ECS, так и для Amazon EKS). Аналитика контейнеров собирает метрики контейнеров (процессора, памяти, диска и сети) и сетевые метрики по умолчанию. Сервис предоставляет более подробную диагностическую информацию (например, о сбоях при перезапуске контейнера), чтобы помочь выявить проблемы и быстро их устранить. Аналитика контейнеров обеспечивает наблюдение за ними на автоматических информационных панелях, что позволяет легко отслеживать состояние и производительность приложений. Также в метриках Аналитики контейнеров можно настроить оповещения CloudWatch, чтобы получать уведомления об аномалиях до того, как это повлияет на производительность приложения.

 

Интернет-монитор показывает, как проблемы Интернета влияют на производительность и доступность между вашими приложениями, размещенными в AWS, и вашими конечными пользователями. Эта информация помогает ускорить диагностику проблем, выполняя ее за несколько минут, а не за несколько дней. Вы можете обозревать измерения для различных временных интервалов и в различной степени детализации географических зон, быстро визуализировать влияние проблем и затем принять меры для улучшения взаимодействия конечных пользователей (например, переключив к другим сервисам AWS или перенаправив трафик рабочей нагрузки через другие регионы AWS). Если проблема вызвана сетью AWS, на панель работоспособности AWS автоматически придет уведомление, в котором будут указаны шаги, предпринимаемые AWS для устранения проблемы. Internet Monitor предоставляет измерения для метрик CloudWatch и журналов CloudWatch, чтобы поддерживать интеграцию информации о работоспособности географических зон и сетей в зависимости от конкретного приложения. Internet Monitor также отправляет сведения о связанных с работоспособностью событиях на Amazon EventBridge, поэтому вы можете настроить оповещения. Internet Monitor контролирует приложение посредством виртуальных частных облаков (VPC) Amazon, баз раздачи Amazon CloudFront и каталогов Amazon WorkSpaces.

Lambda Insights предоставляет автоматические панели управления в консоли CloudWatch. Эти панели отображают производительность и ошибки вычислений. На каждой панели отображается список метрик за выбранный период времени, что позволяет (в зависимости от выбранного интервала и функции) перейти к более подробным журналам приложений, отслеживаниям AWS X‑Ray и событиям производительности.

Сервис Amazon CloudWatch Anomaly Detection применяет алгоритмы машинного обучения для непрерывного анализа данных метрики и обнаруживает аномалии. С его помощью можно создавать предупреждения, пороговые значения для которых автоматически изменяются в отношении шаблонов естественных метрик, например сезонных колебаний в зависимости от времени, дня недели или изменения тенденций. Кроме того, можно визуализировать метрики в виде полос обнаружения аномалий. Таким образом вы сможете отслеживать и выявлять неожиданные изменения в метриках и устранять их причины.

С помощью сервиса Amazon CloudWatch ServiceLens можно из единого центра визуализировать данные о работоспособности, производительности и доступности ваших приложений. Он работает совместно с метриками и журналами CloudWatch, а также с маршрутами из сервиса AWS X-Ray, позволяя вам получать полную картину своих приложений и их зависимостей. Вы можете быстро обнаруживать элементы, ухудшающие производительность, выявлять первопричины проблем, связанных с приложениями, и определять затронутых пользователей. С помощью сервиса CloudWatch ServiceLens можно получить полную картину ваших приложений в трех основных областях: мониторинг инфраструктуры (с использованием метрик и журналов, чтобы понимать, какие ресурсы используются для поддержки ваших приложений), мониторинг транзакций (использование маршрутов для понимания зависимостей между вашими ресурсами) и мониторинг конечных пользователей (использование программ-осведомителей для мониторинга адресов и уведомления вас в случае ухудшения условий работы для конечных пользователей). В сервисе CloudWatch ServiceLens имеется карта сервисов, на которой визуализированы контекстные связи между всеми вашими ресурсами, и интуитивно понятный интерфейс, благодаря чему вы можете еще глубже изучать сопоставленные данные мониторинга.

Сервис Amazon CloudWatch Synthetics упрощает мониторинг адресов приложений. Он круглосуточно и без выходных выполняет тестирование ваших адресов и оповещает вас, если их поведение отличается от ожидаемого. Эти тесты можно настроить для проверки доступности, задержек, транзакций, испорченных или неработоспособных ссылок, пошагового выполнения задач, ошибок загрузки страниц, задержек нагрузки для активов пользовательских интерфейсов, потоков сложных мастеров или потоков проверки в ваших приложениях. Вы также можете использовать сервис CloudWatch Synthetics, чтобы выявлять адреса приложений, для которых получены аварийные сигналы, и сопоставлять их с проблемами базовой инфраструктуры, что позволяет уменьшить MTTR. Благодаря этому новому компоненту сервис CloudWatch теперь собирает трафик программ-осведомителей, которые могут непрерывно проверять условия работы ваших клиентов, даже если их трафик не проходит через ваши приложения. Это позволяет обнаруживать проблемы до того, как их обнаружат ваши клиенты. Сервис CloudWatch Synthetics поддерживает мониторинг ваших REST API, URL-адресов и контента веб-сайтов, проверяет наличие неавторизованных изменений вследствие фишинга, инъекции кода или выполнения межсайтовых сценариев.

Amazon CloudWatch RUM предоставляет возможность контролировать производительность приложений на стороне клиента и снижает MTTR. Он позволяет собирать данные о производительности интернет-приложений на стороне клиента в режиме, близком к реальному времени, чтобы выявлять и диагностировать проблемы. CloudWatch RUM в сочетании с данными CloudWatch Synthetics предоставляет еще больше информации о взаимодействии с пользователем. Вы можете визуализировать аномальные показатели производительности и применять отладочные данные (сообщения об ошибках, трасссировки стеков, сеансы пользователей и так далее) для устранения проблем с производительностью (вызванных ошибками JavaScript, сбоями или задержками). Вы можете получить ценные сведения о разных аспектах влияния на пользователя, например количество подключенных пользователей, их географическое расположение и используемые браузеры. CloudWatch RUM агрегирует данные о пути пользователя в вашем приложении, которые помогут вам определить приоритеты при выпуске новых возможностей и исправлении ошибок.

Принятие мер

Auto Scaling позволяет автоматизировать планирование ресурсов. Можно установить для ключевой метрики пороговое значение, по достижении которого будет отправляться предупреждение и автоматически выполняться действие Auto Scaling. Например, можно настроить рабочий процесс Auto Scaling для добавления или удаления инстансов EC2 на основании метрик загрузки ЦПУ и оптимизировать таким образом затраты на ресурсы.

CloudWatch Events генерирует поток системных событий, описывающих изменение ресурсов AWS, в режиме, близком к реальному времени. Сервис позволяет быстро реагировать на операционные изменения и принимать корректирующие меры. От пользователя требуется только создать правила, прописав в них события, актуальные для приложения, и автоматические действия при наступлении таких событий. Например, можно создать правило для вызова функций AWS Lambda или отправки оповещения в тему Amazon Simple Notification Service (Amazon SNS).

Для кластеров Amazon EKS и k8s Аналитика контейнеров позволяет вызывать предупреждения по вычислительным метрикам, чтобы запускать политики автомасштабирования для группы «Автомасштабирование» Amazon EC2 и предоставляет возможность останавливать, перезапускать и восстанавливать любые инстансы Amazon EC2, а также завершать их работу. В случае с кластерами Amazon ECS вы можете использовать вычислительные метрики из своих задач и сервисов для Автомасштабирования сервисов.  

 

Анализ

Amazon CloudWatch позволяет до 15 месяцев хранить метрики для отслеживания тенденций и сезонности. Это дает возможность анализировать исторические данные для точной настройки использования ресурсов. Кроме того, CloudWatch позволяет получать метрики работоспособности с детализацией вплоть до одной секунды, включая пользовательские метрики из локальных приложений клиента. Точные данные, поступающие в режиме реального времени, повышают качество визуализации и дают возможность определять и отслеживать тенденции для оптимизации производительности приложений и работоспособности системы.

Amazon CloudWatch Metric Math позволяет выполнять расчеты с использованием нескольких метрик в целях анализа в режиме реального времени. Благодаря этому можно без труда получать аналитическую информацию на основании существующих метрик CloudWatch, чтобы лучше понимать состояние и производительность инфраструктуры. Полученные расчетные метрики можно визуализировать в Консоли управления AWS, добавлять их в панели управления CloudWatch или извлекать с помощью действия API GetMetricData. Metric Math поддерживает арифметические операции сложения, вычитания, деления и умножения, а также математические функции суммирования, поиска среднего арифметического, минимума, максимума и среднеквадратического отклонения.

Amazon CloudWatch Logs Insights позволяет извлекать полезную информацию из журналов для решения эксплуатационных проблем без необходимости выделения серверов или управления программным обеспечением. Можно немедленно начать написание запросов, содержащих совокупности, фильтры и регулярные выражения. Кроме того, можно визуализировать данные временных рядов, глубоко изучить отдельные события журнала и экспортировать результаты запросов на панели управления CloudWatch. Это предоставляет полный операционный контроль. Несколькими щелчками в Консоли управления AWS можно начать использовать Logs Insights для запросов ко всем журналам, отправляемым в CloudWatch. Вы платите только за выполненные запросы.

Amazon CloudWatch Logs Live Tail предоставляет клиентам возможность интерактивного глубокого изучения собранных журналов, чтобы они быстро начинали исследование и анализ данных в журналах Amazon CloudWatch. Live Tail позволяет клиентам просматривать все потоковые данные журналов с центральной консоли или интегрировать их в инструменты, которые они используют каждый день для развертывания, эксплуатации или расследований безопасности. С помощью Live Tail можно запускать запросы с глубоким погружением в контекст, поэтому клиенты могут легко перейти от использования представления Live Tail для обнаружения проблем к запросам Аналитики журналов Amazon CloudWatch для глубокого изучения и разрешения инцидентов. Live Tail дополняет существующие аналитические возможности CloudWatch, помогая клиентам сократить время обнаружения и разрешения инцидентов. Этот сервис устраняет зависимость от нескольких пользовательских и сторонних решений для специализированных сценариев использования журналов.

Аналитика контейнеров упрощает анализ наблюдаемых данных на основе метрик, журналов и отслеживаний, делая более удобным переход от автоматических панелей управления к подробным данным событий производительности, журналам приложений (stdout/stderr), пользовательским журналам, предопределенным журналам инстансов Amazon EC2, журналам плоскости данных Amazon EKS/k8s и журналам плоскости управления Amazon EKS c помощью языка расширенных запросов Аналитики журналов CloudWatch.

Сервис Lambda Insights упрощает анализ наблюдаемых данных на основе метрик, журналов и отслеживаний, делая более удобным переход от автоматических панелей управления к подробным данным событий производительности, журналам приложений и пользовательским журналам c помощью языка расширенных запросов CloudWatch Logs Insights.

Теперь сервис Amazon CloudWatch включает сервис Contributor Insights, который анализирует данные временных рядов и создает представления со сведениями об элементах, которые сильнее всего влияют на производительность системы. После настройки сервиса Contributor Insights он работает непрерывно, не требуя вмешательства пользователя. Благодаря этому разработчики и операторы могут быстрее выявлять, диагностировать и устранять проблемы во время эксплуатационных мероприятий. Сервис Contributor Insights помогает понять, кто или что (например, определенный ресурс, аккаунт клиента или вызов API) оказывает влияние на производительность вашей системы и приложений. Это позволяет обнаруживать выбросы, находить самые проблемные шаблоны трафика и ранжировать наиболее используемые системные процессы. Вы можете создавать правила Contributor Insights, чтобы оценивать шаблоны в структурированных событиях журналов по мере их поступления в сервис CloudWatch Logs, в том числе журналов из сервисов AWS, например сервисов AWS CloudTrail, Amazon Virtual Private Cloud (Amazon VPC), Amazon API Gateway и любых других пользовательских журналов, отправляемых вашим сервисом или локальными серверами, например журналов доступа Apache, а также журналов из других облаков. Сервис Contributor Insights оценивает эти события журналов в режиме почти реального времени и отображает отчеты, в которых показаны основные элементы, оказывающие влияние на систему, и количество уникальных элементов в наборе данных. Элемент, оказывающий влияние на систему, – это агрегированная метрика на основе измерений, содержащихся в полях журналов в сервисе CloudWatch Logs, например идентификатор аккаунта или интерфейса в сервисе VPC Flow Logs либо любой другой пользовательский набор измерений. Вы можете сортировать и фильтровать данные этих элементов на основе ваших собственных пользовательских критериев. Данные отчетов Contributor Insights можно отображать на панелях управления CloudWatch, строить на их основе графики рядом с метриками CloudWatch и добавлять их в аварийные сигналы CloudWatch.

Amazon CloudWatch Metrics Insights представляет собой быстрое и гибкое ядро выполнения запросов SQL, которое позволяет выявлять тенденции и шаблоны в изменениях миллионов операционных метрик в режиме, близком к реальному времени. Metrics Insights предоставляет более подробную информацию о производительности приложений и инфраструктуры в большом масштабе, поддерживая гибкие запросы и интерактивное агрегирование метрик. Запросы Metrics Insights позволяют создать мощные и наглядные визуализации, чтобы выполнять упреждающий мониторинг, быстро обнаруживать проблемы и снижать значение MTTR. 

Amazon CloudWatch Evidently позволяет разработчикам приложений проводить эксперименты и выявлять непреднамеренные воздействия новых возможностей, прежде чем развертывать их для открытого использования. Это позволяет снизить риски, связанные с выпуском новых возможностей. Evidently позволяет оценить влияние обновлений на весь стек приложения еще до выпуска, чтобы этот процесс стал более надежным. При выпуске обновлений вы сможете применить их к ограниченному подмножеству пользователей и отслеживать для них ключевые метрики, например время загрузки страниц или показатели конверсии, а затем постепенно увеличивать трафик для обновленной версии. Также Evidently позволяет экспериментировать с дизайном, собирать данные о пользователях и выбирать наиболее эффективные решения. 

 

Соответствие требованиям и безопасность

Сервис Amazon CloudWatch интегрирован с Управлением идентификацией и доступом AWS (IAM), что позволяет контролировать доступ пользователей и ресурсов к данным, а также определять способ доступа к ним.

Кроме того, Amazon CloudWatch Logs соответствует требованиям PCI и FedRamp. Данные шифруются при хранении и передаче. Можно также шифровать группы журналов с помощью AWS Key Management Service (AWS KMS) для обеспечения дополнительной безопасности и соответствия требованиям.

Защита данных журналов Amazon CloudWatch Logs помогает настраивать политики защиты данных, с помощью которых можно обнаруживать и защищать конфиденциальные данные, записываемые системами и приложениями. Эта функция автоматически определяет и маскирует конфиденциальную информацию в журналах, используя машинное обучение и сопоставление шаблонов в соответствии с определенной вами политикой. Защита данных может помочь оптимизировать архитектуру, освободив приложения от логики защиты данных, и в то же время помогает выполнять поставленные цели. Вы можете настроить политики защиты данных для сканирования журналов по мере их заполнения, чтобы определять, насколько конфиденциальную информацию они содержат, и при обнаружении таковой маскировать ее. Маскированные данные могут также раскрываться для проверки, выполняемой инженерами по безопасности, посредством назначения высоких привилегий в IAM.