FAQ Amazon CloudWatch

Questions d'ordre général

Amazon CloudWatch est un service de supervision AWS pour les ressources du cloud et les applications que vous exécutez sur AWS. Vous pouvez utiliser Amazon CloudWatch pour collecter et suivre les mesures, recueillir et surveiller les fichiers journaux et configurer des alarmes. Amazon CloudWatch peut surveiller les ressources AWS de la même façon que les instances Amazon EC2, les tables Amazon DynamoDB et les instances Amazon RDS DB, ainsi que les mesures personnalisées générées par vos applications et services, et tous les fichiers journaux émis par vos applications, hébergés sur place, de façon hybride ou sur d’autres clouds. Vous pouvez utiliser Amazon CloudWatch pour gagner une visibilité à l'échelle du système sur l'utilisation des ressources, la performance de l'application et la santé opérationnelle. Vous pouvez utiliser ces éléments pour réagir et faire en sorte que votre application continue de fonctionner sans heurt.

Pour démarrer la surveillance, vous pouvez utiliser Automatic Dashboards, qui intègre les bonnes pratiques AWS, analyser les écrans des métriques et des alertes basées sur le compte et les ressources, et explorer facilement les informations pour rechercher la cause racine des problèmes de performance.

Vous pouvez accéder à Amazon CloudWatch via une API, l'interface de ligne de commande, les kits SDK AWS et AWS Management Console.

Amazon CloudWatch reçoit et fournit des mesures pour toutes les instances Amazon EC2 et devrait fonctionner avec tous les systèmes d'exploitation actuellement compatibles avec le service Amazon EC2.

Amazon CloudWatch s'intègre à AWS Identity and Access Management (IAM) afin que vous puissiez spécifier quelles actions CloudWatch un utilisateur peut effectuer dans votre compte AWS. Par exemple, vous pouvez créer une politique IAM qui donne l'autorisation d'utiliser GetMetricStatistics à seulement certains utilisateurs de votre entreprise. Ils peuvent ensuite utiliser cette action pour récupérer les données concernant vos ressources dans le cloud.

Vous ne pouvez pas utiliser IAM pour contrôler l'accès aux données CloudWatch pour des ressources spécifiques. Par exemple, vous ne pouvez pas accorder à un utilisateur l'accès aux données CloudWatch pour seulement un ensemble spécifique d'instances ou un équilibreur de charge spécifique. Les autorisations accordées à l'aide d'IAM englobent toutes les ressources dans le cloud que vous utilisez avec CloudWatch. En outre, vous ne pouvez pas utiliser les rôles IAM avec les outils de ligne de commande Amazon CloudWatch.

Amazon CloudWatch Logs vous permet de surveiller et de dépanner vos systèmes et vos applications à l'aide de vos fichiers journaux personnalisés, de vos fichiers journaux système et d'application existants.

Avec CloudWatch Logs, vous pouvez surveiller vos journaux, quasiment en temps réel, pour certains modèles, expressions ou valeurs. Par exemple, vous pouvez configurer une alarme selon le nombre d'erreurs survenues dans vos journaux système ou consulter les graphiques concernant la latence des requêtes web à partir de vos journaux d'application. Vous pouvez ensuite consulter les données de journalisation d'origine pour connaître la source du problème. Vous pouvez stocker et accéder aux données de journalisation indéfiniment dans un stockage hautement durable, à faible coût. Vous n'avez donc plus à vous soucier du remplissage des disques durs.
Amazon CloudWatch Logs vous permet de surveiller et de dépanner vos systèmes et vos applications à l'aide de vos fichiers journaux personnalisés et de vos fichiers journaux système et d'application existants.

CloudWatch Logs est capable de surveiller et de stocker vos journaux afin de vous aider à mieux comprendre et faire fonctionner vos systèmes et vos applications. Vous pouvez utiliser CloudWatch Logs de nombreuses façons différentes.

Surveillance en temps réel des applications et des systèmes : vous pouvez utiliser CloudWatch Logs pour surveiller les applications et les systèmes à l'aide des données de journalisation. Par exemple, CloudWatch Logs peut suivre le nombre d'erreurs survenues dans vos journaux d'application et vous envoyer une notification lorsque le taux d'erreurs dépasse le seuil que vous avez spécifié. CloudWatch Logs utilise vos données de journalisation pour la surveillance ; aucun de code n'est donc requis.

Conservation des journaux à long terme : vous pouvez utiliser CloudWatch Logs pour stocker vos données de journalisation aussi longtemps que vous le souhaitez dans un espace de stockage hautement durable et à faible coût, sans vous soucier des problèmes d'espace libre sur des disques durs. L'agent CloudWatch Logs permet de déplacer rapidement et facilement des fichiers journaux pivotés et non pivotés hors d'un hébergeur et dans le service de journalisation. Vous pouvez ensuite accéder aux données brutes du journal d'évènements lorsque vous en avez besoin.

L'agent CloudWatch Logs est pris en charge sur Amazon Linux, Ubuntu, CentOS, Red Hat Enterprise Linux et Windows. Cet agent prendra en charge la capacité de surveiller des fichiers journaux individuels sur l'hébergeur.

Oui. L'agent CloudWatch Logs est intégré à Identity and Access Management (IAM) et comprend une assistance pour les clés d'accès ainsi que pour les rôles IAM.

Amazon CloudWatch Logs Insights est une fonctionnalité d'analyse de journal interactive, tarifiée à l'utilisation pour CloudWatch Logs. Elle permet aux développeurs, aux opérateurs et aux ingénieurs de comprendre, d'améliorer et de déboguer leurs applications en leur permettant de faire des recherches dans leurs journaux et d'afficher ces derniers. Logs Insights est complètement intégré à CloudWatch, ce qui vous permet de gérer, d'explorer et d'analyser vos journaux. Vous pouvez également utiliser les mesures, les alarmes et les tableaux de bord CloudWatch avec les journaux pour obtenir une visibilité opérationnelle complète sur vos applications. Il vous permet de comprendre vos applications, d'y apporter des améliorations et de détecter et corriger les problèmes rapidement, de manière à ne pas freiner l'innovation. Il offre la possibilité d'écrire des requêtes avec des agrégations, des filtres, des expressions régulières pour extraire les informations utilisables de vos journaux. Vous pouvez également visualiser des données de séries chronologiques, faire des recherches dans les événements de journaux individuels et exporter les résultats de requêtes vers CloudWatch Dashboards.

Vous pouvez immédiatement démarrer avec Logs Insights pour exécuter des requêtes sur tous les journaux envoyées vers CloudWatch Logs. Aucune installation n'est requise, et aucune infrastructure ne doit être gérée. Vous pouvez accéder à Logs Insights depuis AWS Management Console, ou bien par le biais de programmes via vos applications avec un kit SDK AWS.

La détection d'anomalies d'Amazon CloudWatch applique des algorithmes de machine learning pour analyser en continu les données chronologiques uniques des systèmes et des applications, déterminer une référence normale et détecter les anomalies avec une intervention minimale de l'utilisateur. Elle permet de créer des alarmes qui ajustent automatiquement les seuils en fonction de modèles de métriques naturels, tels que l'heure du jour, la saisonnalité du jour de la semaine ou les tendances changeantes. Vous pouvez également visualiser des métriques avec des bandes de détection d'anomalies sur des tableaux de bord, mais aussi surveiller, isoler et résoudre les problèmes relatifs aux modifications inattendues de vos métriques.

Le démarrage avec la détection d'anomalies est facile. Dans la console CloudWatch, accédez à Alarms (Alarmes) dans le panneau de navigation pour créer une alarme, ou commencez avec Metrics (Métriques) pour superposer les valeurs escomptées de la métrique sur le graphique sous la forme d'une bande. Vous pouvez également activer la détection d'anomalies à l'aide de l'interface de la ligne de commande AWS, des kits AWS SDK ou des modèles AWS CloudFormation. Pour en savoir plus, consultez la documentation sur la détection d'anomalies de CloudWatch et les pages de tarification.

Amazon CloudWatch inclut désormais Contributor Insights, qui analyse les données chronologiques afin de fournir une vue des principaux contributeurs ayant une incidence sur les performances du système. Une fois la configuration effectuée, Contributor Insights fonctionne en continu sans intervention supplémentaire de l'utilisateur. Cela aide les développeurs et les opérateurs à isoler, diagnostiquer et résoudre les problèmes plus rapidement lors d'un événement opérationnel.

Dans la console CloudWatch, accédez à Contributor Insights dans le panneau de navigation afin de créer une règle Contributor Insights. Vous pouvez également activer Contributor Insights à l'aide de l'interface de ligne de commande (CLI) AWS, des kits SDK AWS ou des modèles AWS CloudFormation. Contributor Insights est disponible dans toutes les régions commerciales AWS. Pour en savoir plus, consultez la documentation sur CloudWatch Contributor Insights.

Amazon CloudWatch ServiceLens est une fonctionnalité qui vous permet de visualiser et d'analyser l'état, les performances et la disponibilité de vos applications en un lieu unique. CloudWatch ServiceLens relie les métriques et les journaux CloudWatch, ainsi que les traces provenant d'AWS X-Ray pour vous donner une vue complète de vos applications et de leurs dépendances. Cela vous permet d'identifier rapidement les goulots d'étranglement en matière de performance, d'isoler les causes profondes des problèmes d'application et de déterminer l'impact sur les utilisateurs. CloudWatch ServiceLens vous permet de gagner en visibilité sur vos applications dans trois domaines principaux : la surveillance de l'infrastructure (au moyen de métriques et de journaux, pour comprendre les ressources qui prennent en charge vos applications), la surveillance des transactions (au moyen de traces, pour comprendre les dépendances entre vos ressources), et la surveillance des utilisateurs finaux (au moyen de scripts canaris, pour surveiller vos points de terminaison et vous avertir lorsque l'expérience des utilisateurs finaux s'est dégradée).

Si vous utilisez déjà AWS X-Ray, vous pouvez accéder à CloudWatch ServiceLens sur la console CloudWatch par défaut. Si vous n'utilisez pas encore AWS X-Ray, vous pouvez commencer en activant AWS X-Ray sur vos applications utilisant le SDK X-Ray. Amazon CloudWatch ServiceLens est disponible dans toutes les régions AWS publiques où AWS X-Ray est disponible. Pour en savoir plus, consultez notre documentation sur Amazon CloudWatch ServiceLens.

Amazon CloudWatch Synthetics vous permet de surveiller plus facilement les points de terminaison d'applications. CloudWatch Synthetics teste vos points de terminaison toutes les minutes, 24 heures sur 24, 7 jours sur 7 et vous avertit dès que les points de terminaison de votre application ont un comportement anormal. Ces tests peuvent être personnalisés pour vérifier la disponibilité, la latence, les transactions, les liens rompus ou morts, la réalisation de tâches étape par étape, les erreurs de chargement de page, les latences de chargement des ressources de l'interface utilisateur, les flux d'assistants complexes ou les flux de sortie de vos applications. Vous pouvez également utiliser CloudWatch Synthetics pour isoler les points de terminaison d'applications alarmants et les associer aux problèmes d'infrastructure sous-jacents afin de réduire le délai moyen de résolution.

Il est très simple de commencer à utiliser CloudWatch Synthetics. Vous pouvez écrire votre premier script Canary en quelques minutes. Pour en savoir plus, consultez notre documentation sur Amazon CloudWatch Synthetics.

Tarification

Pour obtenir des informations à jour, consultez la page de tarification.

Tous les types d'instances Amazon EC2 envoient automatiquement des métriques d'état et de performances clés à CloudWatch, sans frais. Si vous activez la surveillance détaillée EC2, des frais sont facturés pour les métriques personnalisées en fonction du nombre de métriques envoyées à CloudWatch pour l'instance. Le nombre de métriques envoyées pour une instance dépend du type d'instance. Consultez Métriques CloudWatch de vos instances disponibles pour plus d'informations.

Sauf indication contraire, nos prix n'incluent pas les taxes et redevances applicables, y compris la TVA et les taxes sur les ventes applicables. En savoir plus.

Avant le mois de juillet 2017, les frais à payer pour CloudWatch étaient divisés en deux parties distinctes sur votre facture AWS et les rapports sur les coûts et l'utilisation. Pour des raisons historiques, les frais à payer pour l'utilisation d'alarmes CloudWatch, de métriques CloudWatch et d'API CloudWatch étaient mentionnés sous la section explicative « Elastic Compute Cloud » (EC2) de votre facture, tandis que les frais à payer pour CloudWatch Logs et CloudWatch Dashboards étaient indiqués sous la section explicative « CloudWatch ». Afin de consolider et de simplifier votre utilisation et votre facturation AWS CloudWatch mensuelles, nous avons déplacé les frais à payer pour l'utilisation des métriques, des alarmes et des API CloudWatch de la section « EC2 » de votre facture à la section « CloudWatch », ce qui nous a permis de rassembler efficacement tous les frais que vous devez payer pour la surveillance CloudWatch sous la section « CloudWatch ». Notez que cela n'a aucune incidence sur le montant total de votre facture AWS. Dorénavant, votre facture et vos rapports sur les coûts et l'utilisation présenteront simplement les frais à payer pour CloudWatch sous une même section.

De plus, il existe une métrique de facturation dans CloudWatch, dénommée « Frais estimés », visible sous la forme du « Montant total des frais estimés » ou subdivisée « Par service ». La métrique « Montant total des frais estimés » ne change pas. Cependant, la métrique « Frais estimés » subdivisée « Par service » change pour la dimension ServiceName égale à « AmazonEC2 » et pour la dimension ServiceName égale à « AmazonCloudWatch ». Du fait de la consolidation de la facturation, il est possible que vous remarquiez une diminution de votre métrique de facturation AmazonEC2 et une augmentation de votre métrique de facturation AmazonCloudWatch lors du déplacement des frais d'utilisation et de facturation de la section EC2 à la section CloudWatch.

Logs Insights est facturé par requête et les frais sont calculés à partir de la quantité de données ingérées analysée dans le cadre de la requête. Pour plus de détails sur les tarifs, vous pouvez consulter la tarification CloudWatch.

Oui, si vous annulez manuellement une requête, vous êtes facturé pour la quantité de données de journal assimilée jusqu'à l'annulation de la requête.

Non, vous n'êtes pas facturé lorsque les requêtes échouent.

Observabilité entre comptes

L'observabilité entre comptes dans CloudWatch vous permet de contrôler et de résoudre les problèmes dans les applications étendues sur plusieurs comptes au sein d'une région. Grâce à l'observabilité entre comptes, vous pouvez rechercher, visualiser et analyser de manière transparente vos mesures, journaux et traces sans avoir à vous inquiétez des limites de compte. Vous pouvez commencer par une vue entre comptes agrégée de votre application pour identifier visuellement les ressources qui présentent des erreurs et plonger dans les traces, les mesures et les journaux corrélés pour trouver la cause du problème. La navigation et l'accès aux données transparents entre les comptes, rendus possibles par la surveillance entre comptes, vous aident à réduire les efforts manuels nécessaires pour résoudre les problèmes et à gagner un temps précieux dans la résolution. L'observabilité entre comptes est un ajout à la capacité d'observabilité unifiée de CloudWatch.

L'observabilité entre comptes introduit deux nouveaux concepts de compte. Le « compte de surveillance » est un compte AWS central qui peut visualiser et interagir avec les données d'observabilité générées par d'autres comptes. Un « compte source » est un compte AWS individuel qui génère des données d'observabilité pour les ressources qui y résident. Une fois que vous avez identifié votre compte de surveillance et votre compte source, vous terminez votre configuration de surveillance entre comptes en sélectionnant les données télémétriques à partager avec votre compte de surveillance. En quelques minutes, vous pouvez facilement configurer des comptes de surveillance centraux depuis lesquels vous avez une vue complète de la santé et des performances de vos applications déployées sur de nombreux comptes connexes ou sur une organisation AWS entière. Avec l'observabilité entre comptes dans CloudWatch, vous obtenez une vue d'ensemble des dépendances entre applications susceptibles d'avoir un impact sur la disponibilité du service, et vous pouvez identifier les problèmes de manière proactive et les résoudre avec un délai moyen de résolution réduit.

Grâce à l'observabilité entre comptes, vous pouvez rechercher des groupes de journaux stockés sur plusieurs comptes depuis une vue centrale, exécuter des requêtes Logs Insights entre comptes et créer des règles Contributor Insights sur plusieurs comptes afin d'identifier les principaux contributeurs générant des entrées de journaux. Vous pouvez utiliser la recherche de métriques pour visualiser les métriques de plusieurs comptes dans une vue consolidée, créer des alarmes qui évaluent les mesures d'autres comptes afin d'être informé des anomalies et des problèmes de tendance, et les visualiser sur des tableaux de bord centralisés. Vous pouvez également utiliser cette fonctionnalité pour configurer un flux de métriques unique et inter-comptes afin d'inclure des métriques qui couvrent plusieurs comptes AWS dans une région AWS. Grâce à l'observabilité entre comptes, vous pouvez également afficher une carte interactive de vos applications entre comptes à l'aide de ServiceLens, en explorant d'un simple clic des mesures, journaux et traces pertinents.

La surveillance entre comptes dans CloudWatch et les fonctions entre régions entre comptes seront disponibles sur la console CloudWatch. Les menus déroulants entre comptes et entre régions seront supprimés de la console lorsque vous configurerez l'observabilité entre comptes dans CloudWatch. Notez que l'expérience d'observabilité entre comptes dans CloudWatch est disponible dans une seule région à la fois. La fonction d'observabilité entre comptes et entre régions permet d'accéder à la télémétrie à l'échelle de l'organisation par le biais des rôles IAM. L'observabilité entre comptes dans CloudWatch utilise l'API Observability Access Manager pour définir les politiques d'accès. Pour en savoir plus, reportez-vous à notre documentation.

Surveillance des performances de l'application (APM)

Amazon CloudWatch offre une visibilité complète sur la durée des transactions des applications, offrant aux développeurs une nouvelle expérience de recherche et d'analyse puissante à n'importe quelle échelle. Cette solution complète va au-delà de l'échantillonnage, car elle permet d'établir des liens rapides entre l'impact commercial lié aux transactions et les performances des applications. Grâce à des fonctionnalités d'analyse et de visualisation prêtes à l'emploi, CloudWatch fournit des informations instantanées sur l'état et les performances globales des transactions des applications. Parfaitement intégrée à Application Signals de CloudWatch, cette fonctionnalité permet aux équipes de surveiller, dépanner et optimiser efficacement leurs applications en toute simplicité.

Vous pouvez activer les signaux d'application dans la console de gestion AWS pour CloudWatch ou lors de l'activation de CloudWatch sur les ressources AWS, telles que les clusters Amazon EKS. L'instrumentation des applications est incluse dans l'agent Amazon CloudWatch. Les services d'application, leurs API et leurs dépendances sont découverts et visualisés dans une vue récapitulative et sur une carte des services. Pour refléter l'impact et l'importance de l'entreprise, vous pouvez créer en quelques clics des objectifs de niveau de service (SLO) sur la base de métriques d'application standard, d'utilisateurs réels ou de moniteurs synthétiques. La vue « Activer plus d'APM » dans la console présente une vue sur les ressources surveillées et non surveillées, ce qui permet aux clients d'ajouter progressivement de la visibilité sur les applications. Vous pouvez utiliser les paramètres CloudWatch pour augmenter l'échantillonnage des traces sur les services critiques et capturer davantage d'exemples de transactions critiques, telles que les ordres de paiement. Pour ajouter une surveillance externe de la disponibilité ou des flux de travail d'interface utilisateur, vous pouvez ajouter des canaries synthétiques et, pour améliorer la visibilité des clients, activer la télémétrie RUM sur leurs applications Web. Pour commencer à utiliser Application Signals avec une visibilité complète sur la durée des transactions des applications, consultez la documentation.

Amazon CloudWatch Application Signals découvre les services applicatifs tels qu'un processeur de paiement hypothécaire fonctionnant dans EKS et génère un ensemble standard de métriques d'application pour le volume, la latence, les erreurs et les défauts des API (comme pour ajouter des utilisateurs, passer des commandes, payer, etc.) et des dépendances (comme les appels entre les services applicatifs, vers les services AWS ou vers des points de terminaison externes). Les clients peuvent refléter l'impact commercial et l'importance des services applicatifs, de leurs API et de leurs dépendances en définissant des objectifs de niveau de service. De nouvelles vues d'observabilité centrées sur les applications dans la console de gestion AWS pour CloudWatch résumeront ensuite l'état de santé des applications par rapport aux SLO et proposeront une analyse détaillée permettant d'en déterminer rapidement la cause première.

Utilisez Application Signals pour une expérience intégrée de surveillance des performances des applications. Grâce à la surveillance intégrée, vous pouvez automatiquement collecter et corréler la télémétrie des applications, tout en hiérarchisant les applications critiques. Vous pouvez également exploiter les données relatives aux alarmes, aux traces et aux événements pour prendre des mesures automatisées et réduire le temps nécessaire à la restauration en cas de problème (MTTR). Vous souhaitez surveiller les applications exécutées sur Amazon EKS, Amazon EC2, Amazon ECS, les bases de données, les composants ou les ressources sur site. Il vous suffit de spécifier les ressources à surveiller et d'activer Application Signals pour Amazon EKS dans votre console CloudWatch sans configuration manuelle. Pour tous les autres environnements d'applications, vous pouvez déployer rapidement l'agent CloudWatch et commencer à surveiller vos applications. Avec Application Signals, vous pouvez créer, mesurer et suivre les SLO en fonction de vos KPI commerciaux et opérationnels. Les SLO sont essentiels pour gérer les applications critiques, améliorer la disponibilité, réduire les temps d'arrêt et garantir une expérience client cohérente. Vous devez avoir accès à une vue complète de toutes vos applications et pouvoir gérer les performances des applications. Tirez parti de tableaux de bord automatiques, prédéfinis et standardisés avec l'ensemble de vos applications, services et données de télémétrie. Ces fonctionnalités de visualisation vous permettent d'analyser et d'accéder rapidement à des métriques telles que le volume, la disponibilité, la latence et les erreurs affectant vos applications. Les cartes de service Application Signals vous permettent d'explorer les traces, les API et les ressources de calcul afin d'obtenir une vue complète des causes profondes des problèmes de vos applications. L'intégration d'Amazon CloudWatch RUM et d'Amazon CloudWatch Synthetics dans Application Signals vous donne accès aux données utilisateur en temps réel et aux canaries dans une vue unique. Cela est important si vous devez identifier rapidement la cause première dans votre code, vos dépendances ou votre environnement d'hébergement avant que le problème impacte les utilisateurs finaux.

CloudWatch Application Insights vous aide à surveiller vos applications qui utilisent des instances Amazon EC2 ainsi que d'autres ressources applicatives. Il identifie et configure les indicateurs clés, les journaux et les alarmes relatifs à vos ressources applicatives et à votre infrastructure technologique (par exemple, votre base de données Microsoft SQL Server, vos serveurs Web (IIS) et serveurs d'applications, votre système d'exploitation, vos équilibreurs de charge et vos files d'attente). Il surveille en permanence les métriques et les journaux afin de détecter et de corréler les anomalies et les erreurs. Lorsque des erreurs et des anomalies sont détectées, Application Insights génère des événements CloudWatch que vous pouvez utiliser pour configurer des notifications ou prendre des mesures. Pour vous aider au dépannage, il crée des tableaux de bord automatisés pour les problèmes détectés, dont les anomalies de métriques et les erreurs de journalisation corrélées, ainsi que des informations supplémentaires vous indiquant la cause potentielle.

Amazon CloudWatch Application Signals étend Amazon CloudWatch avec des métriques d'application standardisées et des vues d'observabilité centrées sur les applications dans la console de gestion AWS pour CloudWatch. Vous pouvez commencer sans écrire d'instrumentation personnalisée. Les nouvelles vues résument l'état de santé des applications pour aider à déterminer l'impact commercial et à gérer les priorités, puis proposent une analyse détaillée permettant d'en déterminer rapidement la cause première.
Lorsque les clients optent pour Application Signals avec une visibilité complète sur la durée des transactions des applications, vous pouvez accéder à une nouvelle expérience de recherche et d'analyse puissante à n'importe quelle échelle. Cette solution complète va au-delà de l'échantillonnage, car elle permet d'établir des liens rapides entre l'impact commercial lié aux transactions et les performances des applications. Grâce à des fonctionnalités d'analyse et de visualisation prêtes à l'emploi, CloudWatch fournit des informations instantanées sur l'état et les performances globales des transactions des applications. Cette fonctionnalité permet aux équipes de surveiller, de dépanner et d'optimiser efficacement leurs applications en toute simplicité.

Traces X-Ray

Les traces X-Ray aident les développeurs à analyser et à déboguer les applications distribuées en production, en fournissant une vue de bout en bout des demandes au fur et à mesure qu'elles circulent dans l'application.

Grâce à X-Ray, vous pouvez facilement :

  1. Créez une carte des services : X-Ray suit les demandes visant à cartographier les services utilisés, en affichant les connexions, les arbres de dépendance et les problèmes dans les zones de disponibilité ou les régions.

  2. Identifiez les erreurs et les bogues : X-Ray analyse les codes de réponse pour détecter automatiquement les bogues, ce qui permet un débogage facile sans reproduction.

  3. Créez des applications d'analyse et de visualisation personnalisées : les API de requête de X-Ray permettent de créer des applications qui exploitent les données enregistrées.

Un ensemble de points de données partageant le même identifiant de trace lorsqu'une demande passe par les services de l'application.

  • Segment : données encapsulant un seul composant d'une application distribuée, y compris des données définies par le système et définies par l'utilisateur.

  • Annotation : métadonnées définies par le système ou définies par l'utilisateur associées à un segment.

  • Erreurs : annotations système sur les segments pour les appels qui génèrent des erreurs, notamment les messages, les traces de pile et les détails de la source.

  • Échantillonnage : X-Ray collecte des données pour un nombre statistiquement significatif de demandes, mais pas pour chacune d'entre elles, pour des raisons de performance et de rentabilité.

  • X-Ray Daemon : service qui collecte des traces et les envoie à X-Ray, simplifiant ainsi le processus par rapport à l'utilisation directe de l'API.

Vous pouvez démarrer avec X-Ray en incluant le kit SDK du langage X-Ray dans votre application et en installant le démon X-Ray. Pour en savoir plus, consultez le guide de l'utilisateur de X-Ray.

X-Ray peut être utilisé avec des applications distribuées de n'importe quelle taille, afin de suivre et de déboguer aussi bien des requêtes synchrones que des événements asynchrones. Par exemple, X-Ray peut être utilisé pour suivre des requêtes Web adressées à une application Web ou des événements asynchrones utilisant les files d'attente Amazon SQS.

Vous pouvez utiliser X-Ray avec les applications exécutées sur EC2, ECS, Lambda, Amazon SQS, Amazon SNS et Elastic Beanstalk. En outre, le kit SDK X-Ray capture automatiquement les métadonnées des appels d'API aux services AWS effectués à l'aide du kit SDK AWS. Le kit SDK de X-Ray fournit également des modules complémentaires pour les pilotes MySQL et PostgreSQL.

Si vous utilisez Elastic Beanstalk, vous devrez inclure les bibliothèques X-Ray propres au langage dans le code de votre application. Pour les applications exécutées sur d'autres services AWS, comme EC2 ou ECS, vous devrez installer le démon X-Ray et instrumenter le code de votre application.

Oui, X-Ray fournit un ensemble d'API pour l'ingestion des données de requête, l'interrogation de traces et la configuration du service. Vous pouvez utiliser l'API X-Ray pour développer des applications d'analyse et de visualisation en plus de celles fournies par X-Ray.

Oui. X-Ray enregistre tous les appels d’API en tant qu’événements de gestion. Il enregistre également les appels sur les traces en tant qu’événements de données, notamment sur PutTraceSegments et GetTimeSeriesServiceStatistics, entre autres API. Les événements liés aux données ne sont pas enregistrés par défaut. Pour enregistrer les événements liés aux données, vous devez configurer votre historique CloudTrail ou votre magasin de données d’événements pour les collecter.

Surveillance des conteneurs

CloudWatch Container Insights est une fonction de surveillance, de dépannage et d'alarme destinée aux applications et microservices conteneurisées. Container Insights simplifie l'isolation et l'analyse des problèmes de performances affectant votre environnement conteneurisé. Les ingénieurs DevOps et systèmes bénéficient de l'accès aux tableaux de bord automatiques de la console CloudWatch, ce qui leur offre une visibilité opérationnelle de bout en bout sur les métriques, les journaux et les suivis distribués résumant les performances et l'intégrité de leurs clusters Amazon Elastic Container Service for Kubernetes (EKS), Amazon Elastic Container Service (ECS), AWS Fargate et Kubernetes par pod/tâche, conteneur et services.

Container Insights avec observabilité améliorée pour Amazon Elastic Kubernetes Service (EKS) vous permet d'explorer visuellement de haut en bas les couches de vos conteneurs EKS et de détecter facilement les problèmes tels que les fuites de mémoire dans des conteneurs individuels, réduisant ainsi le temps moyen de résolution. Grâce aux métriques du plan de contrôle, vous pouvez désormais surveiller l'état de l'autoscaling et planifier le cycle de vie de vos clusters de test dans leurs capacités de test automatisées afin d'améliorer l'efficacité opérationnelle. Grâce à une observabilité améliorée pour EKS, vous pouvez désormais trier vos clusters, nœuds et charges de travail en fonction de la consommation de ressources et identifier rapidement les anomalies, configurer vos propres alarmes pour surveiller de près et atténuer les risques de manière proactive avant que l'expérience de l'utilisateur final ne soit affectée.

Oui. En utilisant Container Insights avec une observabilité améliorée pour Amazon Elastic Kubernetes Service (EKS), vous pouvez surveiller l'état de votre plan de contrôle. Vous pouvez l'utiliser pour comprendre l'état de l'autoscaling et planifier les cycles de vie de votre cluster de test dans vos fonctionnalités de test automatisées, par exemple.

Container Insights avec une observabilité améliorée pour Amazon Elastic Kubernetes Service (EKS) fournit des métriques d'état et de performances détaillées et prêtes à l'emploi, notamment des métriques de performance EKS au niveau du conteneur, des métriques Kube-state et des métriques du plan de contrôle EKS pour une identification et une résolution plus rapides des problèmes. L'observabilité améliorée permet aux clients d'explorer visuellement de haut en bas les différentes couches de conteneurs et de détecter facilement les problèmes tels que les fuites de mémoire dans les conteneurs individuels, réduisant ainsi le délai moyen de résolution. Grâce aux métriques du plan de contrôle, les clients peuvent désormais surveiller l'état de l'autoscaling et planifier le cycle de vie de leurs clusters de test dans leurs capacités de test automatisées afin d'améliorer l'efficacité opérationnelle. Grâce à une observabilité améliorée, les clients peuvent désormais trier leurs clusters, nœuds et charges de travail en fonction de la consommation de ressources et identifier rapidement les anomalies, configurer leurs propres alarmes pour surveiller de près et atténuer les risques de manière proactive avant que l'expérience de l'utilisateur final ne soit affectée. L'observabilité améliorée est une fonctionnalité optionnelle. Container Insights sans observabilité améliorée fournit des métriques agrégées au niveau des clusters et des services.

Oui. Vous pouvez décider d'utiliser Container Insights avec ou sans observabilité améliorée par cluster. Vous pouvez activer l'observabilité améliorée pour vos clusters en installant le module complémentaire d'observabilité CloudWatch pour EKS dans vos clusters après leur création à l'aide de l'onglet Modules complémentaires de la vue d'informations de votre cluster. Consultez la documentation CloudWatch Container Insights pour savoir comment configurer votre agent CloudWatch afin de permettre une meilleure observabilité pour EKS.

Container Insights avec observabilité améliorée prend en charge Amazon EKS.

Vous pouvez commencer à collecter des métriques de performance détaillées, des journaux et des métadonnées à partir de vos conteneurs et clusters ou activer votre module complémentaire CloudWatch Observability pour améliorer l'observabilité en quelques clics. Pour commencer à utiliser Container Insights, veuillez suivre les étapes décrites dans la documentation Amazon CloudWatch Container Insights.

De plus amples informations sur la tarification de Container Insights sont disponibles sur la page de tarification de CloudWatch.

Non. Actuellement, seuls les jauges et les compteurs sont pris en charge. Les histogrammes et les résumés seront ajoutés lors d'une prochaine mise à jour.

Prometheus est un logiciel de surveillance open source populaire, intégré à la Cloud Native Compute Foundation (CNCF). La communauté open source a développé plus de 150 modules d'extension et défini un cadre que les équipes DevOps peuvent utiliser pour exposer les métriques personnalisées devant être collectées à partir des applications au travers d'une approche basée sur la demande. Grâce à cette nouvelle fonctionnalité, les équipes DevOps peuvent automatiquement découvrir les services associés aux charges de travail conteneurisées telles qu'AWS App Mesh, NGINX et Java/JMX. Elles peuvent alors exposer des métriques personnalisées sur ces services et les ingérer dans CloudWatch. En organisant la collecte et l'agrégation des métriques Prometheus, les utilisateurs CloudWatch peuvent plus rapidement surveiller, dépanner et alerter en cas de dégradations et de défaillances des performances de l'application, tout en réduisant le nombre d'outils de surveillance nécessaires.

Les métriques Prometheus sont ingérées automatiquement en tant que métriques CloudWatch personnalisées. La durée de conservation est de 15 mois par point de données de métriques avec un cumul automatique (pour une période de surveillance de moins de 60 secondes, la durée de conservation est de 3 heures, pour 1 minute, elle est de 15 jours, pour 5 minutes, elle est de 63 jours et pour 1 heure, de 15 mois). Pour en savoir plus, consultez la documentation sur la conservation des métriques CloudWatch.

Oui. Chaque cluster Kubernetes (k8s) dispose de son propre groupe de journaux (p. ex. : /aws/containerinsights//prometheus) dont la période de conservation est configurable individuellement. Pour en savoir plus, consultez la documentation sur la conservation des groupes de journaux.

Non. Toutes les métriques sont ingérées sous la forme d'événements CloudWatch Logs et peuvent être interrogées à l'aide de requêtes CloudWatch Logs Insights. Pour plus d'informations, consultez la documentation sur la syntaxe du langage de recherche de CloudWatch Logs Insights.

Vous serez facturé sur la base de ce que vous utilisez pour ces services : (1) journaux CloudWatch Logs ingérés par gigaoctet (Go), (2) journaux CloudWatch Logs stockés et (3) métriques CloudWatch personnalisées. Consultez la page de tarification de CloudWatch pour connaître les coûts détaillés dans votre Région AWS.

Surveillance avec Internet

Moniteur Internet Amazon CloudWatch vous aide à surveiller en permanence la disponibilité d'Internet et les métriques de performance entre vos applications hébergées par AWS et les utilisateurs finaux des applications. Avec Moniteur Internet Amazon CloudWatch, vous pouvez visualiser rapidement l'impact des problèmes, identifier les sites et les fournisseurs affectés, et prendre des mesures pour améliorer l'expérience réseau de vos utilisateurs finaux. Vous pouvez obtenir une vue d'ensemble des schémas de trafic et des événements sanitaires, et obtenir des informations sur les événements à différentes échelles géographiques. Si le réseau AWS est à l'origine d'un problème, vous recevrez une notification dans le tableau de bord AWS Health qui vous indiquera les mesures prises par AWS pour atténuer le problème. Moniteur Internet fournit également des informations et des recommandations qui peuvent vous aider à améliorer l'expérience de vos utilisateurs à l'aide d'autres services AWS.

Pour utiliser Moniteur Internet, vous devez créer un moniteur et y associer les ressources de votre application, le cloud privé virtuel (VPC) d'Amazon, les distributions CloudFront ou les répertoires WorkSpaces, pour permettre au Moniteur Internet de savoir où se trouve le trafic Internet de votre application. Moniteur Internet fournit ensuite les mesures Internet d'AWS qui sont spécifiques aux emplacements et aux réseaux qui communiquent avec votre application.

Vous pouvez ensuite utiliser le tableau de bord CloudWatch pour connaître les événements de santé, afficher les scores de performance et de disponibilité, explorer les données historiques de votre application à différentes granularités géographiques et obtenir des indications sur la façon de configurer votre application pour améliorer les performances pour vos utilisateurs finaux.

Moniteur Internet publie les métriques Internet dans les journaux et les métriques CloudWatch, afin que vous puissiez facilement utiliser les outils CloudWatch pour mieux comprendre la santé des applications dans les zones géographiques et les réseaux spécifiques à votre application. Moniteur Internet envoie également les évènements de santé à Amazon EventBridge afin que vous puissiez configurer les notifications.

Au fur et à mesure que vous explorez Moniteur Internet, il est utile de se familiariser avec les composants et les concepts que vous verrez référencés dans le service. Moniteur Internet utilise ou fait référence aux éléments suivants : moniteur, journaux CloudWatch, métriques CloudWatch, réseaux urbains, événements de santé, numéros de systèmes autonomes (ASN), ressource surveillée, métriques Internet, temps d'aller-retour, octets transférés et scores de performance et de disponibilité.

Vous trouverez une description rapide de ces composants dans la documentation.

La tarification du moniteur internet comprend les éléments suivants : des frais par ressource surveillée, des frais par réseau urbain, et des frais pour les journaux de diagnostic publiés dans les journaux CloudWatch. Pour plus d'informations, reportez-vous à la page de tarification de Moniteur Internet Amazon CloudWatch.

Pour Moniteur Internet, la prise en charge régionale dépend des types de ressources que vous ajoutez à votre moniteur. Pour les distributions Amazon CloudFront et les répertoires Amazon WorkSpaces, Moniteur Internet est disponible dans toutes les régions prises en charge. Pour les clouds privés virtuels (VPC) Amazon, les VPC d'une région à option d'adhésion peuvent être ajoutés uniquement à un moniteur créé dans la même région. Pour obtenir la liste complète des Régions AWS prises en charge, reportez-vous à la section points de terminaison de Moniteur Internet Amazon CloudWatch.

Surveillance avec Lambda

CloudWatch Lambda Insights est une fonction qui permet de surveiller, de dépanner et d'optimiser les performances et le coût de vos fonctions Lambda. Lambda Insights simplifie l'isolation et l'analyse des problèmes de performances affectant votre environnement Lambda. Les DevOps et ingénieurs système ont accès à des tableaux de bord automatiques dans la console CloudWatch, ce qui leur donne une visibilité opérationnelle de bout en bout des mesures, des journaux et des traces résumant les performances et la santé des fonctions AWS Lambda.

Vous pouvez démarrer la collecte de mesures de performance détaillées, de journaux et de métadonnées à partir de vos fonctions Lambda en suivant les étapes suivantes dans la documentation de CloudWatch Lambda Insights.

CloudWatch Lambda Insights collecte automatiquement des métriques personnalisées à partir des événements de performance ingérés comme CloudWatch Logs depuis vos fonctions Lambda. Pour plus d'informations sur la tarification, consultez la page de tarification CloudWatch.

Les réseaux

Le moniteur réseau fournit la visibilité sur les performances ainsi que sur le réseau qui connecte vos applications hébergées par AWS à vos destinations sur site. Le moniteur réseau vous permet de visualiser rapidement les pertes de paquets et la latence de vos connexions réseau hybrides, de définir des alertes et des seuils, puis de prendre des mesures pour améliorer l’expérience réseau de vos utilisateurs finaux. Si vos connexions réseau hybrides se font via AWS Direct Connect, le moniteur réseau vous permet d’identifier la source de toute baisse des performances réseau en quelques minutes.

Le moniteur réseau gère la latence aller-retour et la perte de paquets pour chaque sonde configurée sur le moniteur. En outre, pour les connexions réseau hybrides via AWS Direct Connect, le moniteur réseau fournit une métrique pour l’indicateur d’intégrité du réseau AWS. Ces métriques sont agrégées par sous-réseau de VPC et par point de terminaison de destination et publiées sur Amazon CloudWatch. Vous pouvez ensuite accéder aux tableaux de bord CloudWatch depuis la console du moniteur réseau pour visualiser ces métriques, configurer des alarmes et consulter l’état d’intégrité du réseau AWS afin de savoir quand les problèmes réseau ont affecté les performances. Vous pouvez également évaluer la perte de paquets et la latence aller-retour en observant l’historique des métriques enregistrées sur 30 jours ou en configurant des alarmes pour être averti des événements réseau.

La tarification du moniteur réseau comprend les éléments suivants : des frais par ressource surveillée et des frais pour les métriques publiées sur CloudWatch. Pour plus d’informations, consultez la tarification Amazon CloudWatch et accédez à l’onglet Moniteur réseau.

Pour utiliser le moniteur réseau, vous devez créer un moniteur et y associer les ressources de votre application. Vous choisissez les sous-réseaux sources appartenant à vos Amazon Virtual Private Cloud (VPC), puis vous choisissez les adresses IP de destination dans votre réseau sur site. Le moniteur réseau crée un maillage des combinaisons possibles de sources et de destinations (appelées chacune sonde) au sein d’un seul moniteur. La création de moniteurs réseau est entièrement gérée par AWS, et vous devriez être en mesure de consulter les métriques en temps réel quelques minutes après la configuration de vos moniteurs. Le moniteur réseau transmet ces métriques en temps réel à CloudWatch Metrics, de sorte que vous puissiez facilement utiliser les outils CloudWatch pour mieux comprendre l’état du réseau dans les régions AWS spécifiques à votre réseau. Consultez la documentation de CloudWatch pour obtenir des instructions de configuration détaillées.

Surveillance de l'expérience numérique

Amazon CloudWatch DEM vous permet de surveiller la façon dont les utilisateurs finaux se servent de vos applications (notamment en ce qui concerne les performances, la disponibilité et la convivialité). 

Repérez les problèmes intermittents, recevez des notifications même en l'absence de trafic utilisateur et surveillez vos points de terminaison et votre interface utilisateur à l'aide de scripts Canary Synthetic CloudWatch. Complétez la surveillance synthétique avec CloudWatch RUM pour comprendre l'impact sur l'utilisateur final et obtenir une meilleure visibilité de votre expérience numérique. Avec CloudWatch Evidently, améliorez l'expérience numérique des utilisateurs finaux en expérimentant et en validant de nouvelles conceptions et fonctions. 

Amazon CloudWatch RUM est une fonction de surveillance des utilisateurs réels qui vous permet de connaître les performances côté client d'une application pour vous aider à réduire le temps moyen de récupération (MTTR). Avec CloudWatch RUM, vous pouvez collecter en temps réel des données côté client sur les performances des applications web pour identifier et déboguer les problèmes. Cette application complète les données CloudWatch Synthetics pour vous donner plus de visibilité sur l'expérience numérique de l'utilisateur final. Vous pouvez visualiser les anomalies de performance et utiliser les données de débogage pertinentes (telles que les messages d'erreur, les traces de pile et les sessions utilisateur) pour résoudre les problèmes de performance (tels que les erreurs JavaScript, les plantages et les latences). Vous pouvez également comprendre les différents impacts sur les utilisateurs finaux, notamment le nombre de sessions, les géolocalisations ou les navigateurs. CloudWatch RUM rassemble des données sur le parcours de vos utilisateurs dans votre application, ce qui peut vous aider à déterminer les fonctions à lancer et les corrections de bogues à privilégier.

Créez un moniteur d'applications dans CloudWatch RUM et ajoutez le client web léger dans l'en-tête HTML de votre application. Ensuite, commencez à utiliser les tableaux de bord de CloudWatch RUM pour recevoir des informations sur les utilisateurs depuis des géolocalisations, des appareils, des plateformes et des navigateurs différents. 

Amazon CloudWatch Evidently vous permet de mener des expériences et d'identifier les conséquences involontaires des nouvelles fonctions avant de les déployer pour un usage général, réduisant ainsi les risques liés au déploiement de nouvelles fonctions. Evidently vous permet de valider les nouvelles fonctions sur l'ensemble de la pile d'applications avant la publication, pour plus de sécurité. Lorsque vous lancez de nouvelles fonctions, vous pouvez les exposer à une petite base d'utilisateurs, surveiller les métriques clés telles que les temps de chargement des pages ou les conversions, puis augmenter le trafic. Evidently permet également aux développeurs d'essayer différentes conceptions, de recueillir des données sur les utilisateurs et de mettre en production la conception la plus efficace. Evidently vous aide à interpréter et à agir sur les résultats des expériences sans avoir besoin de connaissances statistiques avancées. Vous pouvez utiliser les informations fournies par le moteur statistique d'Evidently (comme la valeur p et les intervalles de confiance à tout moment) pour prendre des décisions pendant qu'une expérience est en cours.

Vous pouvez utiliser l'extrait de code JavaScript de CloudWatch RUM pour collecter les parcours des utilisateurs côté client et les métriques de performance. Si vous le souhaitez, vous pouvez également ajouter des métriques personnalisées comme les conversions en utilisant l'API Evidently. Ensuite, les nouvelles fonctions à tester peuvent être instrumentées avec le SDK Evidently de CloudWatch, qui permet de contrôler la façon dont les utilisateurs sont exposés aux nouvelles fonctions. Vous pouvez maintenant effectuer des lancements et des expériences, en utilisant la console AWS ou la CLI. 

Amazon CloudWatch Synthetics vous permet de surveiller plus facilement les points de terminaison d'applications. CloudWatch Synthetics teste vos points de terminaison toutes les minutes, 24 heures sur 24, 7 jours sur 7 et vous avertit dès que les points de terminaison de votre application ont un comportement anormal. Ces tests peuvent être personnalisés pour vérifier la disponibilité, la latence, les transactions, les liens rompus ou morts, la réalisation de tâches étape par étape, les erreurs de chargement de page, les latences de chargement des ressources de l'interface utilisateur, les flux d'assistants complexes ou les flux de sortie de vos applications. Vous pouvez également utiliser CloudWatch Synthetics pour isoler les points de terminaison d'applications alarmants et les associer aux problèmes d'infrastructure sous-jacents afin de réduire le délai moyen de résolution.

Il est très simple de commencer à utiliser CloudWatch Synthetics. Vous pouvez écrire votre premier script Canary en quelques minutes. Pour en savoir plus, consultez notre documentation sur Amazon CloudWatch Synthetics.

Les deux services peuvent être utilisés séparément, mais sont encore plus performants quand ils sont conjugués.

AppConfig est une fonction d'AWS Systems Manager que vous pouvez utiliser pour créer, gérer et déployer des indicateurs de fonctionnalités et d'autres configurations d'applications. Lorsque vous développez de nouvelles fonctions, vous pouvez utiliser AppConfig pour déployer une nouvelle fonction en production, mais la cacher derrière un indicateur à bascule. Une fois que vous êtes prêt à la lancer, il vous suffit de mettre à jour votre configuration pour libérer la fonction instantanément ou progressivement.

Pour une gestion et une expérimentation plus avancées des fonctions, vous pouvez utiliser Evidently, qui est une nouvelle fonctionnalité d'Amazon CloudWatch. Avec Evidently, vous pouvez mener des expériences sur différentes variations d'une fonction et les comparer à une fonction de référence, ou lancer une variation d'une fonction selon un calendrier, tout en surveillant les métriques métiers comme la durée des visites et les revenus. Evidently s'intègre à CloudWatch RUM, qui permet la surveillance des performances applicatives côté client. Les métriques de RUM sont ainsi exploitables directement dans Evidently.

Analyse des métriques

CloudWatch Metrics Insights est un moteur de requête haute performance qui vous aide à découper vos mesures opérationnelles en temps réel et à créer des agrégations à la volée en utilisant des requêtes SQL standard. Metrics Insights vous aide à comprendre l'état de santé et les performances de vos applications en vous donnant la possibilité d'analyser vos mesures à grande échelle. Cette application est intégrée aux tableaux de bord CloudWatch. Vous pouvez donc enregistrer vos requêtes dans des tableaux de bord d’état et de performances pour surveiller de manière proactive les problèmes et les identifier rapidement.

Pour commencer, il suffit de cliquer sur l'onglet de mesures de votre console CloudWatch. Metrics Insights est alors indiqué comme moteur de requête intégré dans l'onglet Requête et ce, sans coût supplémentaire. Bien que Metrics Insights soit livrée avec le langage SQL standard, vous pouvez démarrer avec Metrics Insights en utilisant le générateur de requêtes visuel. Pour utiliser ce générateur, sélectionnez visuellement les métriques, les espaces de noms et les dimensions qui vous intéressent ; la console génère ensuite automatiquement vos requêtes SQL conformément à vos choix. Vous pouvez utiliser l'éditeur de requêtes pour saisir vos requêtes SQL brutes quand vous le souhaitez, afin d'effectuer une recherche approfondie et d'identifier les problèmes de manière plus précise. L'application Metrics Insights est également livrée avec un ensemble d'exemples de requêtes prêts à l'emploi qui peuvent vous aider à commencer à surveiller et à étudier les performances de vos applications instantanément. Metrics Insights est également disponible par programmation via CloudFormation, le SDK AWS et la CLI.

Surveillance des ressources et des mesures personnalisées AWS

Amazon CloudWatch vous permet de surveiller les ressources du cloud AWS et les applications que vous exécutez sur AWS. Les mesures sont fournies automatiquement pour un nombre de produits et services AWS, notamment les instances Amazon EC2, les volumes EBS, les programmes Elastic Load Balancer, les groupes Auto Scaling, les flux de travail EMR, les instances de base de données RDS, les tables DynamoDB, les clusters ElastiCache, les clusters RedShift, les piles OpsWorks, les vérifications de l'état Route 53, les rubriques SNS, les files d'attente SQS, les flux SWF et les passerelles de stockage. Vous pouvez également surveiller les mesures personnalisées générées par vos applications et services.

Vous pouvez publier et stocker des métriques personnalisées jusqu'à une résolution d'une seconde. La conservation étendue des métriques a été lancée le 1er novembre 2016 et a augmenté le stockage de toutes les métriques des clients de 14 jours à 15 mois. CloudWatch assure la rétention les données métriques comme suit :

Les points de données d'une durée de moins de 60 secondes sont disponibles pendant 3 heures. Ces points de données sont des métriques personnalisées à haute résolution.

Les points de données d'une durée de 60 secondes (1 minute) sont disponibles pendant 15 jours

Les points de données d'une durée de 300 secondes (5 minutes) sont disponibles pendant 63 jours 

Les points de données d'une durée de 3 600 secondes (1 heure) sont disponibles pendant 455 jours (15 mois)

Les points de données qui sont initialement publiés avec une période plus courte sont agrégés pour le stockage à long terme. Par exemple, si vous collectez des données à l'aide d'une période d'une minute, les données resteront disponibles pendant 15 jours avec une résolution d'une minute. Après 15 jours, ces données seront toujours disponibles, mais en forme agrégée et seulement à une résolution de 5 minutes. Après 63 jours, les données sont agrégées de nouveau et sont disponibles à une résolution d'une heure. Si vous avez besoin d'une période de disponibilité plus longue pour ces métriques, vous pouvez utiliser l'API GetMetricStatistics pour récupérer les points de données sur un autre espace de stockage ou hors ligne.

Cette fonctionnalité est actuellement disponible dans les régions É.-U. Est (Virginie du Nord), É.-U. Ouest (Oregon), USA Ouest (Californie du Nord), UE (Irlande), UE (Francfort), Amérique du Sud (São Paulo), Asie-Pacifique (Singapour), Asie-Pacifique (Tokyo), Asie-Pacifique (Séoul), Asie-Pacifique (Mumbai), Asie-Pacifique (Sydney), UE (Londres), Canada (Central), É.-U. Est (Ohio) et Chine (Beijing).

La résolution minimale des points de données prise en charge par CloudWatch est d'une seconde, ce qui est une métrique à haute résolution. Vous pouvez également stocker les métriques à une granularité d'une minute. Parfois, les métriques sont reçues par CloudWatch à des intervalles irréguliers tels que 3 ou 5 minutes. Si vous ne spécifiez pas qu'une métrique est en haute résolution en configurant le champ StorageResolution dans la requête API PutMetricData, alors CloudWatch agrégera et stockera les métriques avec une résolution d'une minute par défaut.

Selon l'âge des données demandées, les métriques sont disponibles avec la résolution définie dans les programmes de rétention décrits ci-dessus. Par exemple, si vous demandez les données sur 1 minute pour une journée datant d'il y a 10 jours, vous recevrez les 1 440 points de données. Cependant, si vous demandez des données sur 1 minute datant de 5 mois, l'interface passe automatiquement à la granularité de 1 heure et l'API GetMetricStatistics ne renvoie aucun résultat.

CloudWatch ne prend pas en charge la suppression des métriques. Les métriques arrivent à expiration selon les programmes de rétention décrits ci-dessus.

Oui, Amazon CloudWatch prend en charge les requêtes de données provenant de plusieurs sources, ce qui vous permet de surveiller les métriques sur AWS, sur site et dans d'autres clouds. Vous pouvez désormais résoudre les problèmes critiques en quelques minutes, et plutôt qu'en quelques heures, et gagner en visibilité sur l'état de votre application, en faisant apparaître des informations plus rapidement pour des opérations fluides. Centralisez vos requêtes, votre visualisation et vos alarmes sur tous vos outils de surveillance en un seul endroit.

Vous pouvez toujours récupérer les métriques des instances Amazon EC2 selon les programmes de rétention décrits ci-dessus. Cependant, la console CloudWatch limite la recherche de métriques à 2 semaines après la dernière intégration d'une métrique donnée, afin de n'afficher que les instances les plus à jour dans votre espace de noms.

Oui. Amazon CloudWatch stocke les métriques pour les instances Amazon EC2 terminées ou les Elastic Load Balancer supprimés pendant 15 mois.

Pour commencer, accédez au générateur de requêtes de métriques dans la console Amazon CloudWatch et ouvrez le sélecteur de source de données. Le sélecteur vous permet de lancer un assistant pour ajouter une nouvelle source de données à interroger et activer une alarme. Vous choisissez la source de données que vous souhaitez interroger et vous spécifiez les détails d'accès tels qu'une URL ou un chemin et des informations d'identification. Pour plus de détails, consultez la documentation.

Si vous affichez la même fenêtre temporelle avec une période de 5 minutes ou avec une période de 1 minute, vous pourrez voir que les points de données sont affichés à différents endroits du graphique. Pour la période que vous spécifiez dans votre graphique, Amazon CloudWatch trouvera tous les points de données disponibles et calculera un seul point additionné pour représenter le période entière. Dans le cas d'une période de 5 minutes, le seul point de données est placé au début de la fenêtre temporelle de 5 minutes. Dans le cas d'une période de 1 minute, le seul point de données est placé à la marque 1 minute. Nous conseillons d'utiliser la période de 1 minute pour la résolution des problèmes et autres activités qui nécessitent les représentations graphiques de période les plus précises.

Vous pouvez utiliser Amazon CloudWatch pour surveiller les données produites par vos applications, scripts et services. Le terme mesure personnalisée désigne toute mesure que vous fournissez à Amazon CloudWatch. Par exemple, vous pouvez utiliser les mesures personnalisées pour surveiller le temps de chargement d'une page web, les taux d'erreurs d'une requête, le nombre de processus ou de menaces sur votre instance, ou la quantité de travail exécutée par votre application. Vous pouvez débuter avec les métriques personnalisées à l'aide de l'API PutMetricData, de nos modèles de scripts de surveillance pour Windows et Linux et du plug-in collectd pour CloudWatch, ainsi que par le biais de plusieurs applications et outils offerts par les partenaires AWS.

Une métrique personnalisée peut avoir l'une des résolutions suivantes :

Résolution standard, avec données d'une granularité d'une minute

Haute résolution, avec données d'une granularité d'une seconde

Par défaut, les métriques sont stockées à une résolution d'une minute dans CloudWatch. Vous pouvez définir une métrique comme étant à haute résolution en configurant le paramètre StorageResolution sur 1 dans la requête API PutMetricData. Si vous ne configurez pas le paramètre optionnel StorageResolution, CloudWatch stockera par défaut les métriques à une résolution d'une minute.

Lorsque vous publiez une métrique à haute résolution, CloudWatch la stocke avec une résolution d'une seconde, et vous pouvez la lire et la récupérer avec une période de 1 seconde, 5 secondes, 10 secondes, 30 secondes ou de tout multiple de 60 secondes.

Les métriques personnalisées sont soumises au même échéancier de préservation mentionné ci-dessus.

Actuellement, seules les métriques personnalisées que vous publiez dans CloudWatch sont disponibles à une haute résolution. Les métriques personnalisées à haute résolution sont stockées dans CloudWatch à une résolution d'une seconde. La haute résolution est définie par le paramètre StorageResolution dans la requête API PutMetricData avec une valeur de 1, et elle n'est pas un champ obligatoire. Si vous ne spécifiez pas de valeur dans le champ optionnel StorageResolution, CloudWatch stockera la métrique personnalisée à une résolution d'une minute par défaut.

Non, les métriques personnalisées à haute résolution sont tarifées de la même façon que les métriques personnalisées régulières d'une minute.

Vous pouvez surveiller vos données à l'aide des mesures personnalisées, de CloudWatch Logs ou des deux. Vous avez la possibilité d'utiliser les mesures personnalisées si vos données ne sont pas déjà générées au format des journaux, par exemple les données concernant les opérations du système d'exploitation ou les mesures de performance. Vous pouvez également écrire votre propre application ou script, ou un fourni par un partenaire AWS. Si vous souhaitez stocker et enregistrer des mesures individuelles ainsi que des informations supplémentaires, vous pouvez envisager d'utiliser CloudWatch Logs.

Vous pouvez récupérer, présenter sous forme de graphique et configurer des alarmes sur les valeurs statistiques suivantes pour les métriques Amazon CloudWatch : moyenne, somme, minimum, maximum et comptage par échantillonnage. Les statistiques peuvent être calculées par intervalles de temps, multiples de une minutes ou 60 secondes. Pour les métriques personnalisées à haute résolution, les statistiques peuvent être calculées pour une période située entre 1 seconde et 3 heures.

Amazon CloudWatch Application Insights pour .NET et SQL Server est une fonctionnalité que vous pouvez utiliser pour surveiller facilement vos applications .NET et SQL Server. Elle vous aide à trouver et configurer des métriques et des journaux clés sur vos ressources d'application et votre pile technologique, c.-à-d. les bases de données, serveurs Web (IIS) et d'applications, système d'exploitation, équilibreurs de charge, files d'attente, etc. Il surveille en permanence ces données de télémétrie afin de détecter et de corréler les anomalies et les erreurs, et de vous signaler tout problème concernant votre application. Pour faciliter le dépannage, il crée des tableaux de bord automatiques qui aident à visualiser les problèmes détectés dont les anomalies métriques et erreurs de journalisation corrélées, ainsi que des informations supplémentaires vous indiquant la cause potentielle.

Reconnaissance automatique des métriques et les journaux des applications : elle analyse les ressources de votre application, fournit une liste des métriques et des journaux recommandés pour la surveillance et les configure automatiquement, facilitant ainsi la configuration de la surveillance pour vos applications. 

Détection intelligente des problèmes : elle utilise des règles intégrées et des algorithmes de machine learning pour surveiller et analyser de manière dynamique les symptômes d'un problème dans votre pile d'applications et détecter les problèmes rencontrés. Elle vous aide à réduire les frais généraux occasionnés par le traitement de pics de métrique, d'événements ou d'enregistrements de journalisation, et à être notifié des problèmes réels, ainsi que des informations contextuelles sur ces problèmes.

Dépannage plus rapide : elle évalue les problèmes détectés pour vous en donner une description ; cause première possible du problème détecté, liste des métriques et des journaux impactés en raison du problème. Vous pouvez commenter les informations générées afin de rendre le moteur de détection de problèmes spécifique à votre cas d'utilisation.

Application embarquée : précisez l'application que vous souhaitez surveiller en choisissant le groupe de ressources AWS qui en est associé.

Identification des composants de l'application : elle analyse les ressources de votre application pour identifier les composants de l'application (ressources autonomes ou groupes de ressources associées telles que des groupes Auto Scaling et des groupes d'équilibreurs de charge). Vous pouvez également personnaliser les composants en regroupant les ressources pour obtenir de meilleures informations et une intégration facile.

Activation de la surveillance : pour vos composants d'application, vous pouvez spécifier le niveau technologique, c'est-à-dire le système front-end IIS, le niveau de travail .NET, etc. En fonction de votre sélection, elle fournit un ensemble recommandé d'indicateurs et de journaux pouvant être personnalisés en fonction de vos besoins. Une fois ces « moniteurs » enregistrés, Application Insights pour .NET et SQL Server configurent CloudWatch pour les collecter en votre nom.

Une fois intégrée, Application Insights pour .NET et SQL Server utilise une combinaison de règles prédéfinies et de modèles de machine learning pour commencer à identifier les problèmes d'application. Elle crée des tableaux de bord automatisés sur CloudWatch avec la liste des problèmes détectés, ainsi qu'une vue détaillée de ces problèmes, des anomalies et des erreurs associées.

CloudWatch Metric Streams est une fonctionnalité qui vous permet de diffuser en continu des métriques CloudWatch vers une destination de votre choix avec un minimum d'installation et de configuration. Il s'agit d'une solution entièrement gérée, pour laquelle vous ne devez rédiger aucun code ni entretenir aucune infrastructure. En seulement quelques clics, vous pouvez configurer un flux de métriques vers des destinations telles qu'Amazon Simple Storage Service (S3). Vous pouvez également envoyer vos métriques vers une sélection de fournisseurs de service tiers afin de garder vos tableaux de bord à jour.

Metric Streams offre une solution alternative pour obtenir des données métriques de CloudWatch sans avoir recours à des API de sondage. Vous pouvez créer un flux de métriques en seulement quelques clics et vos données métriques commenceront à être diffusées vers votre destination. Vous pouvez diriger en toute facilité vos métriques vers votre data lake sur AWS tel qu'Amazon S3, et commencer à analyser l'utilisation ou les performances avec des outils tels qu'Amazon Athena. Metric Streams facilite également l'envoi de métriques CloudWatch à des fournisseurs de service tiers à l'aide d'un point de terminaison HTTP Amazon Kinesis Data Firehose. Vous pouvez créez un flux continu et évolutif qui inclut les données métriques CloudWatch les plus récentes afin d'alimenter les tableaux de bord, les alarmes et tout autre outil reposant sur des données métriques précises et à jour.

Vous pouvez créez des flux Metric Streams via la console CloudWatch ou en les programmant via l'API CloudWatch, le kit SDK AWS, la CLI AWS ou AWS CloudFormation pour approvisionner et configurer les flux Metric Streams. Vous pouvez également utiliser les modèles AWS CloudFormation fournis par des fournisseurs de services tiers pour configurer une diffusion Metric Streams vers des destinations extérieures à AWS. Pour plus d'informations, consultez la documentation sur CloudWatch Metric Streams.

Oui. Vous avez la possibilité d'envoyer toutes les métriques par défaut ou de créer des règles de filtrage pour inclure ou exclure des groupes de métriques définis par un nom d'espace, par exemple AWS/EC2. Metric Streams détecte automatiquement les nouvelles règles de filtrage de correspondance de métriques et inclut les mises à jour de métrique dans le flux. Une fois les ressources résiliées, Metric Streams arrête automatiquement l'envoi de mises à jour des métriques désactivées.

Metric Streams peut exporter aux formats OpenTelemetry ou JSON. Vous pouvez sélectionner le format de sortie lorsque vous créez ou gérez des flux de métriques.

Oui. Vous pouvez consultez la section relative à la surveillance sur la page de la console Metric Streams. Vous verrez des tableaux de bord automatiques pour le volume de métriques mises à jour au fur et à mesure. Ces métriques sont également disponibles sous le nom d'espace AWS/CloudWatch et peuvent être utilisées pour créer des alertes afin d'envoyer des notifications en cas de pic de volume inhabituel.

Surveillance des journaux

CloudWatch Logs vous permet de surveiller et de dépanner vos systèmes et vos applications à l'aide de vos fichiers journaux personnalisés, de vos fichiers journaux système et d'application existants.

Avec CloudWatch Logs, vous pouvez surveiller vos journaux, quasiment en temps réel, pour certains modèles, expressions ou valeurs. Par exemple, vous pouvez configurer une alarme selon le nombre d'erreurs survenues dans vos journaux système ou consulter les graphiques concernant la latence des requêtes web à partir de vos journaux d'application. Vous pouvez ensuite consulter les données de journalisation d'origine pour connaître la source du problème. Vous pouvez stocker et accéder aux données de journalisation aussi longtemps que vous le souhaitez dans un stockage hautement durable, à faible coût. Vous n'avez donc plus à vous soucier du remplissage des disques durs.

Les journaux payants Amazon CloudWatch sont des journaux publiés de façon native par les services AWS pour le compte des clients. Les journaux de flux VPC sont les premiers journaux à bénéficier de ce modèle différencié. D'autres types de journaux liés au service AWS seront ajoutés par la suite.

Pour plus d'informations sur la disponibilité du service CloudWatch Logs par région, reportez-vous à la section relative aux produits et services régionaux.

Pour obtenir des informations à jour, consultez la page de tarification.

CloudWatch Logs est capable de surveiller et de stocker vos journaux afin de vous aider à mieux comprendre et faire fonctionner vos systèmes et vos applications. Lorsque vous utilisez CloudWatch Logs avec vos journaux, vos données de journalisation sont utilisées pour la surveillance. Aucun changement de code n'est donc requis. Voici deux exemples présentant ce qu'il est possible de faire avec Amazon CloudWatch et vos journaux :

Supervision en temps réel des applications et des systèmes : vous pouvez utiliser CloudWatch Logs pour surveiller les applications et les systèmes à l'aide des données de journalisation quasiment en temps réel. Par exemple, CloudWatch Logs peut suivre le nombre d'erreurs survenues dans vos journaux d'application et vous envoyer une notification lorsque le taux d'erreurs dépasse le seuil que vous avez spécifié. Amazon CloudWatch utilise vos données de journalisation pour assurer la supervision, et ne nécessite donc aucun changement de code de votre part.

Conservation des journaux à long terme : vous pouvez utiliser CloudWatch Logs pour stocker vos données de journalisation aussi longtemps que vous le souhaitez dans un espace de stockage hautement durable et à faible coût, sans vous soucier des problèmes d'espace libre sur des disques durs. L'agent CloudWatch Logs permet de déplacer rapidement et facilement des fichiers journaux pivotés et non pivotés hors d'un hébergeur et dans le service de journalisation. Vous pouvez ensuite accéder aux données brutes du journal d'évènements lorsque vous en avez besoin.

Vous pouvez configurer le service EC2Config afin d'envoyer une large gamme de données et de fichiers journaux vers CloudWatch, notamment : fichiers journaux personnalisés, journaux d'événement (application, personnalisé, sécurité, système), journaux Event Tracing (ETW), et données Performance Counter (PCW). Pour en savoir plus sur le service EC2Config, cliquez ici.

L'agent CloudWatch Logs envoie des données de journalisation toutes les cinq secondes par défaut et peut être configuré par l'utilisateur.

CloudWatch Logs peut intégrer, regrouper et surveiller tout format de données de journalisation texte répandu, ainsi que les journaux au format JSON.

L'agent CloudWatch Logs consignera une erreur s'il a été configuré de façon à signaler les données de journalisation sans texte. Cette erreur est enregistrée dans /var/logs/awslogs.log.

Vous pouvez surveiller les journaux d'événements lorsqu'ils sont transmis à CloudWatch Logs en créant des filtres de mesures. Les filtres de mesure transforment les données de journalisation en mesures Amazon CloudWatch à des fins de graphique ou d'alarme. Les filtres de mesure peuvent être créés dans la console ou dans l'interface de ligne de commande. Les filtres de mesure recherchent et font correspondre les termes, les expressions ou les valeurs dans vos journaux d'évènements. Lorsqu'un filtre de mesure trouve un de ces termes, expressions ou valeurs dans vos journaux d'évènements, il le compte dans la mesure Amazon CloudWatch de votre choix. Par exemple, vous pouvez créer un filtre de mesure pour rechercher et dénombrer l'apparition du mot « Erreur » dans vos journaux d'évènements. Les filtres de mesure peuvent également extraire des valeurs de vos journaux d'évènements séparés par un espace, telles que la latence des requêtes web. Vous pouvez aussi utiliser des opérateurs conditionnels et des caractères génériques pour créer des correspondances parfaites. La console Amazon CloudWatch peut vous aider à tester vos modèles avant de créer des filtres de mesure.

Un modèle de filtre de mesure peut contenir des termes de recherche ou une spécification du format ordinaire de vos journaux d'événements ou du format d'événement JSON.

Par exemple, si vous souhaitez rechercher le terme Erreur, le modèle du filtre de mesure sera simplement le terme Erreur. Vous pouvez ajouter plusieurs termes recherchés pour effectuer une recherche sur plusieurs termes. Par exemple, si vous souhaitez dénombrer les évènements qui contiennent les termes Erreur et Exception, vous utiliserez le modèle Erreur Exception. Si vous voulez faire correspondre parfaitement le terme Erreur Exception, vous placerez des guillemets autour du terme recherché ("Erreur Exception"). Vous pouvez indiquer autant de termes recherchés que vous le souhaitez.

CloudWatch Logs peut également être utilisé pour extraire des valeurs d'un événement dans les formats de journaux répandus ou dans le format JSON. Par exemple, vous pouvez suivre les octets transférés depuis vos journaux d'accès Apache. Vous pouvez aussi utiliser des opérateurs conditionnels et des caractères génériques pour faire correspondre et extraire les données qui vous intéressent. Pour se servir de la fonctionnalité d'extraction des filtres de mesure, les journaux d'événements doivent être séparés par un espace et utiliser des guillemets doubles « " », ou un crochet ouvrant « [ » et un crochet fermant « ] », pour insérer les champs. Il peut également s'agir d'événements de journal au format JSON. Pour obtenir de plus amples informations sur la syntaxe, ainsi que des exemples, consultez le Guide du développeur pour les filtres de mesure.

CloudWatch Logs vous permet de tester les modèles de filtre de mesure que vous souhaitez avant la création d'un filtre de mesure. Vous pouvez tester vos modèles sur vos données de journalisation qui sont déjà présentes dans CloudWatch Logs ou vous pouvez fournir vos journaux d'évènements à des fins de test. Tester vos modèles vous permettra de visualiser quels journaux d'évènements correspondent au modèle de filtre de mesure et, en cas d'extraction des valeurs, quelles valeurs extraites sont présentent dans les données soumises au test. Le test des filtres de mesure est disponible pour une utilisation dans la console et dans l'interface de ligne de commande.

Les filtres de mesure Amazon CloudWatch ne prennent pas en charge les expressions régulières. Pour traiter vos données de journalisation avec des expressions régulières, envisagez d'utiliser Amazon Kinesis et connectez le flux à un moteur de traitement des expressions régulières.

Gestion des journaux

Vous pouvez récupérer toutes vos données de journalisation à l'aide de la console CloudWatch Logs ou par le biais de l'interface de ligne de commande CloudWatch Logs. Les journaux d'évènements sont récupérés en fonction du journal de groupe, du journal des flux et de la date auxquels ils sont associés. L'API CloudWatch Logs pour récupérer les journaux d'évènements est GetLogEvents.

Vous pouvez utiliser l'interface de ligne de commande pour récupérer vos journaux d'évènements et faire des recherches dans ceux-ci à l'aide de grep de la ligne de commande ou des fonctions de recherche similaires.

Vous pouvez stocker vos données de journalisation dans CloudWatch Logs aussi longtemps que vous le souhaitez. Par défaut, CloudWatch Logs stocke vos données de journalisation pendant une durée indéfinie. Vous pouvez modifier la durée de conservation pour chaque journal de groupe à tout moment.

Amazon CloudWatch Logs Standard est l'une des deux classes de journaux proposées par CloudWatch. Logs Standard fournit une gestion complète des journaux destinée à la surveillance en temps réel et à des fonctionnalités d'analytique avancées telles que Live Tail, l'extraction de métriques, les alarmes et la protection des données. Vous pouvez surveiller vos journaux, quasiment en temps réel, pour certains modèles, expressions ou valeurs. Par exemple, vous pouvez configurer une alarme selon le nombre d'erreurs survenues dans vos journaux système ou consulter les graphiques concernant la latence des requêtes web à partir de vos journaux d'application. Vous pouvez ensuite consulter les données de journalisation d'origine pour connaître la source du problème.

Amazon CloudWatch Logs d’accès peu fréquent (Logs-IA) est l'une des deux classes de journaux proposées par CloudWatch. Logs-IA est spécialement conçu pour consolider tous vos journaux de manière native sur AWS. Il propose l'ingestion gérée, l'analyse des journaux entre comptes et le chiffrement de CloudWatch Logs Standard, pour un faible prix d'ingestion par Go. Cette combinaison de fonctionnalités personnalisées et de faible coût fait de CloudWatch Logs-IA la solution idéale pour les requêtes ad hoc et les analyses scientifiques a posteriori. Vous pouvez stocker et accéder aux données de journalisation indéfiniment dans un stockage hautement durable, à faible coût. Vous n'avez donc plus à vous soucier du remplissage des disques durs.

Amazon CloudWatch Logs d’accès peu fréquent (Logs-IA) est disponible dans toutes les régions AWS où CloudWatch Logs est disponible. Vous pouvez démarrer dans la console ou par programmation via la CLI ou les API AWS

Analyse des fichiers journaux

Pour accéder à Logs Insights, votre stratégie IAM doit inclure des autorisations pour logs:DescribeLogGroups et logs:FilterLogEvents.

Vous pouvez utiliser Logs Insights pour interroger tous les journaux envoyés à CloudWatch. Logs Insights détecte automatiquement les champs des journaux en provenance des services AWS tels que Lambda, CloudTrail, Route53 et VPC Flow Logs ; et n'importe quel journal d'application qui génère des événements de journal au format JSON. En outre, pour tous les types de journaux, il génère 3 champs système, @message, @logStream et @timestamp pour chaque journal transmis à CloudWatch. @message contient l'événement de journal brut non analysé, @logStream contient le nom de la source qui a généré l'événement de journal, et @timestamp contient l'heure à laquelle le journal d'événement a été ajouté à CloudWatch.

Logs Insights présente un nouveau langage de requête spécial pour le traitement des journaux. Le langage de la requête prend en charge un petit nombre de commandes performantes. Vous pouvez rédiger des commandes pour extraire un ou plusieurs champs de journaux, trouver des événements de journal correspondant à un ou plusieurs critères de recherche à partir de vos journaux texte. Le langage de la requête est simple à apprendre, et Logs Insights propose une aide dans le produit sous forme d'exemples de requête, de descriptions de commande et d'exécution automatique de requête pour vous aider à le maîtriser. Vous trouverez d'autres détails sur le langage de requête ici.

Les limites de service sont documentées ici.

Logs Insights est disponible dans les régions AWS suivantes : USA Ouest (Oregon), USA Ouest (Californie du Nord), USA Est (Ohio), USA Est (Virginie du Nord),, Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Central), UE (Francfort) UE (Irlande), UE (Londres), UE (Paris), Amérique du Sud (São Paulo).

Vous pouvez rédiger des requêtes contenant des agrégations, des filtres, des expressions standard et des recherches de texte. Vous pouvez également extraire des données d'événements de journal pour créer des champs éphémères dont le traitement peut être approfondi par le langage de requête, ce qui vous permet d'accéder aux informations que vous recherchez. Le langage de requête prend en charge les chaînes de caractères, les chiffres et les fonctions mathématiques telles que concat, srdlen, trim, log et sqrt entre autres. Vous pouvez utiliser des expressions booléennes et logiques, et agréger des fonctions telles que min, max, somme, moyenne et pourcentage, entre autres. Vous trouverez d'autres détails sur le langage de requête et les fonctions prises en charge ici.

Vous trouverez une liste des commandes de requêtes ici. Vous trouverez une liste des fonctions prises en charge ici.

Vous pouvez utiliser la visualisation pour identifier les tendances et les schémas qui se produisent au fil du temps à l'intérieur de vos journaux. Logs Insights prend en charge la visualisation des données à l'aide graphiques de courbes et de zones empilés. Il génère des schémas pour toutes les requêtes contenant une ou plusieurs fonctions agrégées dans lesquelles les données sont regroupées selon un intervalle de temps spécifiés en utilisant la fonction bin(). Vous trouverez d'autres informations sur la visualisation des données de séries temporelles ici.

Vous pouvez utiliser des expressions régulières Java avec Logs Insights. Les expressions régulières peuvent être utilisées dans la commande de filtrage. Vous trouverez des exemples de requêtes avec des expressions régulières dans l'aide du produit ou ici.

Vous pouvez utiliser des accents graves pour utiliser les caractères spéciaux d'échappement. Les noms de champs de journaux contenant des caractères autres que les caractères alphanumériques @, exigent des caractères d'échappement avec accents graves.

Les champs système générés par Logs Insights commencent par @. Actuellement, Logs Insights génère 3 champs système @message, qui contient l'événement de journal brut non analysé envoyé à CloudWatch, @logStream, qui contient le nom de la source qui a généré l'événement de journal, et @timestamp, qui contient l'heure à laquelle l'événement de journal a été ajouté à CloudWatch.

Logs Insights vous permet de gérer des données de journaux de requêtes qui ont été ajoutées à CloudWatch Logs le 5 novembre 2018 ou après.

Vous pouvez rechercher des événements du journal à partir d'un flux de journaux spécifique en ajoutant le filtre de commande de requête @logStream = "log_stream_name" à votre requête de journal.

CloudWatch Logs prend déjà en charge les options d'intégration à d'autres services AWS tels qu'Amazon Kinesis, Amazon Kinesis Data Firehose, Amazon Elasticsearch et des solutions de partenaires AWS ISV comme Splunk, Sumo Logic et DataDog, entre autres, afin de vous offrir le choix et la flexibilité dans tous les environnements, pour le traitement, l'enrichissement, l'analyse de votre journal personnalisé, et les besoins de visualisation. En outre, les fonctionnalités de requêtes de CloudWatch Logs Insights sont disponibles pour un accès par programmation via le kit SDK AWS pour permettre aux partenaires AWS ISV de mettre en place une intégration plus profonde, des analyses avancées et une valeur supplémentaire à celle de CloudWatch Logs Insights.

Les intégrations de partenaires ISV dans CloudWatch Logs Insights vous permettent de placer vos données de journal en un seul endroit et ont la capacité d'analyser avec les outils et les frameworks de votre choix de manière performante, efficace, sans avoir à déplacer de grandes quantités de données. Il fournit également un accès plus rapide à vos journaux en supprimant les latences de transfert des données associées et élimine les complexités opérationnelles de la configuration et la mise à jour de certains transferts de données.

Détection des anomalies des journaux

Utilisant la technologie d'IA/ML, la détection des anomalies d'Amazon CloudWatch Logs est une fonctionnalité d'analyse automatique des journaux qui vous aide à regrouper les journaux associés au cluster pour accélérer l'investigation des journaux, à comparer vos journaux au fil du temps pour obtenir des informations clés, à surveiller vos journaux et à vous avertir en cas de comportement inhabituel afin d'y remédier plus rapidement. À l'aide d'algorithmes avancés, CloudWatch peut détecter automatiquement les tendances et les modifications inhabituelles dans les journaux de vos applications, vous alertant ainsi en cas de problèmes potentiels. Vous n'avez plus besoin de mettre à jour les requêtes ou les filtres chaque fois que vos journaux changent. Grâce à la détection des anomalies des journaux, vous pouvez détecter les erreurs émergentes et les pics dans les messages de journal à un stade précoce avant qu'ils ne vous impactent, identifier les nouveaux problèmes sans avoir à connaître les détails à l'avance, être alerté en cas d'activité inhabituelle sans avoir à configurer de paramètres et surveiller en permanence vos journaux les plus importants. En identifiant les problèmes potentiels de manière proactive, la détection des anomalies de CloudWatch Logs vous aide à garder une longueur d'avance sur les problèmes et à garantir des performances fiables.
 

La détection des anomalies d'Amazon CloudWatch Logs permet de détecter automatiquement les comportements inhabituels dans les journaux de vos applications. Alors que des outils tels que les filtres de métriques vous permettent de surveiller des variables spécifiques connues, la détection des anomalies peut identifier des conditions auparavant inconnues, telles qu'un code d'erreur récemment apparu dans vos journaux ou une augmentation soudaine d'un message de journal particulier. La détection des anomalies dans les journaux évolue de manière flexible avec les journaux de vos applications au fil du temps et ne vous oblige pas à définir des paramètres de configuration complexes tels que la syntaxe des requêtes ou des filtres. La détection des anomalies de Logs fournit un niveau d'assurance supplémentaire pour les groupes de journaux de vos applications les plus critiques.

La détection des anomalies d'Amazon CloudWatch Logs ne nécessite pas de format spécifique de journaux pour fonctionner. La fonctionnalité utilise le machine learning pour analyser vos journaux de manière flexible. La détection des anomalies de CloudWatch Logs convient particulièrement aux journaux d'applications, tels que ceux générés à partir du code d'application exécuté dans EC2, EKS, ECS, Lambda et d'autres ressources permettant d'exécuter du code d'application.

Amazon DevOps Guru propose une fonctionnalité de détection des anomalies spécialement conçue pour des sources d'applications spécifiques telles que Lambda. La détection des anomalies d'Amazon CloudWatch Logs est une solution qui fonctionne avec n'importe quel journal d'application. La détection des anomalies de CloudWatch Logs est disponible dans la console CloudWatch.

Journaux Live Tail

Amazon CloudWatch Logs Live Tail est une nouvelle fonctionnalité d'analyse interactive qui vous fournit une vue en temps réel de vos journaux entrants. Avec Live Tail, vous pouvez rapidement résoudre les problèmes : les développeurs peuvent tirer parti d'une vue en continu de leurs journaux pour déboguer leur code, et les ingénieurs informatiques peuvent surveiller de manière fiable l'état de leurs déploiements. Live Tail fournit une vue interactive en temps réel des journaux dans le contexte des événements associés afin de réduire le temps moyen de détection et, par conséquent, le temps moyen de résolution.

Vous devez utiliser la fonctionnalité interactive CloudWatch Live Tail pour détecter immédiatement les problèmes d'application ou de déploiement au sein de vos outils AWS Observability natifs. Live Tail permet aux équipes DevOps d'obtenir une visibilité approfondie sur vos journaux d'applications critiques et sur le code de débogage depuis votre environnement de développement sans avoir à passer d'un outil à l'autre. En utilisant Live Tail pour surveiller l'état et l'intégrité des déploiements, les ingénieurs informatiques, le support opérationnel et les équipes de sécurité centrales peuvent surveiller efficacement leurs services et applications afin d'accélérer l'analyse des causes premières et de réduire le temps moyen de résolution.

En plus de fournir des fonctionnalités Live Tail sur des journaux d'applications personnalisés, Live Tail aide également les clients à obtenir des informations détaillées sur les journaux par AWS Services, notamment Amazon Virtual Private Cloud, Amazon Route53, AWS Lambda, Amazon Elastic Kubernetes Service, Amazon Elastic Container Service, Amazon Elastic Container Service, etc. À l'aide du widget Live Tail, les services AWS peuvent intégrer la même expérience interactive de suivi en direct à vos consoles. En outre, l'intégration directe peut également être mise en œuvre par d'autres services (tels qu'Amazon Managed Grafana, AWS Thinkbox) afin de vous fournir les mêmes fonctionnalités d'analyse approfondie depuis votre propre console et depuis n'importe quel journal d'application qui génère des événements du journal.

Pour que cette fonctionnalité fonctionne comme prévu, les utilisateurs doivent pouvoir effectuer les opérations suivantes. Lorsque vous démarrez une session Live Tail, si vous ne faites pas partie du rôle d'administrateur ou si vous avez une politique incluant des journaux :*, veillez à ajouter les actions ci-dessous à votre déclaration de politique : les journaux :StartLiveTail et les journaux :StopLiveTail.

En savoir plus sur les limites du service Live Tail.

Cette fonctionnalité est disponible dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Californie du Nord), USA Ouest (Oregon), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Centre), UE (Francfort), UE (Irlande), UE (Paris) et Amérique du Sud (São Paulo).

Vous pouvez filtrer en fonction des groupes de journaux, des flux de journaux et filtrer par mots-clés. La sélection des groupes de journaux permet de sélectionner plusieurs comptes dans le compte de surveillance (observabilité entre comptes). La sélection des flux de journaux prend en charge plusieurs sélections basées sur un nom ou un préfixe. Le filtre par mots-clés est sensible à la casse. Un ou plusieurs mots-clés (par exemple, erreur, exception ou faute) peuvent être saisis pour affiner davantage la recherche. Vous pouvez saisir les mots-clés ou les copier-coller à partir des exemples fournis dans le panneau Informations. En savoir plus sur les modèles de filtres.

Non, Live Tail fournit une vue en temps réel des données des journaux collectées par CloudWatch. Pour les journaux historiques, consultez les fonctionnalités Logs Insights et groupe de journaux.

Protection des données des journaux

La protection des données est une fonction dans CloudWatch Logs qui vous permet de définir vos propres règles et politiques afin de détecter et de masquer automatiquement les données sensibles dans les journaux collectés à partir de vos systèmes et applications. Cette opération est réalisée à l'aide du machine learning (ML) et de la correspondance des motifs. Les données peuvent être visualisées sans être masquées avec des privilèges élevés d'IAM (Identity and Access Management).

Pour éviter d'enregistrer dans les journaux des données sensibles, les clients s'appuient parfois sur une enquête manuelle ou en configurant des politiques de conservation des journaux courts pour supprimer les journaux, ce qui fait courir le risque de perdre de précieux journaux opérationnels. La protection des données de CloudWatch Logs est conçue pour identifier et masquer automatiquement les informations sensibles dans vos journaux à l'aide de la correspondance de motifs et du ML, sans que personne n'ait à y accéder. Cette fonction est utile pour les industries soumises à des réglementations strictes qui doivent s'assurer qu'aucune information personnelle n’est stockée. De même, les clients qui créent des services de paiement ou d'authentification nécessitant de nombreuses informations personnelles et sensibles peuvent utiliser cette nouvelle fonction pour réduire la probabilité que des informations inutiles soient stockées dans leurs journaux.

Lorsque vous créez la politique de protection des données dans CloudWatch Logs, vous pouvez préciser les données que vous souhaitez protéger. Vous pouvez choisir parmi de nombreux identificateurs de données, tels que des adresses électroniques, des permis de conduire de nombreux pays, des numéros de cartes de crédit, des adresses, etc. Cette variété d'identificateurs de données ciblés vous offre la flexibilité de choisir les données sensibles utilisées par vos applications et de masquer les données sensibles qui n'ont pas besoin d'être facilement accessibles. Il est important que vous décidiez quelles informations sont sensibles pour votre application et que vous choisissiez les identificateurs pertinents pour vos cas d'utilisation.

Alarmes

Vous pouvez créer une alarme pour surveiller n'importe quelle mesure Amazon CloudWatch de votre compte. Par exemple, vous pouvez créer des alarmes sur l'utilisation de la CPU d'une instance Amazon EC2, la latence des requêtes Amazon ELB, le débit d'une table Amazon DynamoDB, la longueur de la file d'attente Amazon SQS, et même sur les frais de votre facture AWS.

Vous pouvez aussi créer une alarme sur les métriques personnalisées spécifiques à vos propres applications ou infrastructures. Si la métrique personnalisée est une métrique à haute résolution, vous pouvez créer des alarmes à haute résolution qui vous alertent dans une période aussi courte que 10 secondes ou 30 secondes.

Avec des alarmes composites, vous pouvez combiner plusieurs alarmes dans des hiérarchies d'alarmes. Cela réduit le bruit des alarmes en ne le faisant sonner qu'une seule fois lorsque plusieurs alarmes se déclenchent au même moment. Vous pouvez fournir un état général pour un regroupement de ressources comme une application, une région AWS ou une zone de disponibilité.

Veuillez consulter la page de tarification CloudWatch pour en savoir plus.

Lorsque vous créez une alarme, vous pouvez la configurer de sorte qu'elle exécute une ou plusieurs actions automatisées lorsque la mesure que vous choisissez de surveiller dépasse le seuil que vous avez indiqué. Par exemple, vous pouvez configurer une alarme qui vous envoie un e-mail, publie sur une file d'attente SQS, arrête ou met fin à une instance Amazon EC2, ou exécute une politique Auto Scaling. Comme les alarmes Amazon CloudWatch sont intégrées à Amazon Simple Notification Service, vous pouvez également utiliser tout type de notification pris en charge par SNS. Vous pouvez utiliser l'action AWS Systems Manager OpsCenter pour créer automatiquement un OpsItem lorsque l'alarme passe à l'état ALARME. Cela vous aide à diagnostiquer les problèmes des ressources AWS et à les résoudre rapidement depuis une seule console.

Lorsque vous créez une alarme, vous sélectionnez d'abord la mesure Amazon CloudWatch que vous souhaitez que l'alarme surveille. Ensuite, vous choisissez la période d'évaluation (cinq minutes ou une heure par ex.) et une valeur statistique à mesurer (moyenne ou maximum par ex.). Pour fixer un seuil, saisissez une valeur cible et indiquez si l'alarme se déclenche lorsque la valeur est supérieure (>), supérieure ou égale (>=), inférieure (<), ou inférieure ou égale (<=) à la valeur en question.

Les alarmes continuent d'évaluer les mesures selon le seuil que vous avez choisi, même lorsqu'elles se sont déjà déclenchées. Ceci vous permet de consulter à tout moment son état actuel à jour. Vous pourrez remarquer qu'une de vos alarmes reste longtemps en état d'alarme. Si votre valeur de mesure excède toujours votre seuil, l'alarme restera en état d'alarme jusqu'à ce que la valeur ne dépasse plus le seuil. Ce comportement est normal. Si vous souhaitez que votre alarme accepte ce nouveau niveau, vous pouvez ajuster le seuil de l'alarme en conséquence.

L'historique d'alarmes est disponible pendant 14 jours. Pour consulter votre historique d'alarmes, connectez-vous à CloudWatch dans AWS Management Console, sélectionnez Alarmes dans le menu de gauche, choisissez votre alarme, puis cliquez sur l'onglet Historique dans le panneau inférieur. Dans cet onglet, vous trouverez un historique des changements d'état de l'alarme ainsi que toutes les modifications apportées à la configuration de l'alarme.

Tableaux de bord

Les tableaux de bord Amazon CloudWatch vous permettent de créer, de personnaliser et de sauvegarder des graphiques de ressources et des mesures personnalisées AWS et d'interagir avec eux.

Pour démarrer, accédez à la console Amazon CloudWatch, puis sélectionnez « Tableaux de bord ». Cliquez sur le bouton « Créer un tableau de bord ». Vous pouvez également copier la vue souhaitée depuis Automatic Dashboards en cliquant sur Options -> « Ajouter au tableau de bord ».

Automatic Dashboards intègre les meilleures pratiques recommandées pour AWS service, tient compte des ressources disponibles, et est mis à jour de manière dynamique pour prendre en compte l'état le plus récent des mesures de performance importantes. Il est désormais possible de filtrer et de résoudre les problèmes dans un écran spécifique sans ajouter de code pour afficher l'état le plus récent de vos ressources AWS. Une fois que vous avez identifié la cause première d'un problème de performance, vous pouvez agir rapidement en accédant directement à la ressource AWS.

Oui. Les tableaux de bord s'actualisent automatiquement lorsque vous les gardez ouverts.

Oui. Toute personne disposant des autorisations adéquates pour le compte dans lequel le tableau de bord est enregistré peut accéder à ce dernier.

Événements

Amazon CloudWatch Events (CWE) est un flux d'événements de système décrivant les modifications apportées à vos ressources AWS. Le flux d'événements augmente les flux de métriques et de journaux CloudWatch existants pour offrir une meilleure vue d'ensemble de vos applications. Vous écrivez des règles déclaratives pour associer des événements qui vous intéressent à des actions automatiques.

CloudWatch Events prend actuellement en charge Amazon EC2, Auto Scaling et AWS CloudTrail. Via AWS CloudTrail, les appels d'API en mutation (c'est-à-dire tous les appels sauf Describe*, List* et Get*) dans tous les services sont visibles dans CloudWatch Events.

Lorsqu'un événement correspond à une règle que vous avez créée dans le système, vous pouvez automatiquement appeler une fonction AWS Lambda, transmettre l'événement vers un flux Amazon Kinesis, notifier une rubrique Amazon SNS ou appeler un workflow intégré.

Oui. Vos applications peuvent transmettre des événements personnalisés à l'aide de l'API PutEvents, avec un corps de message adapté à vos besoins uniques.

CloudWatch Events est capable de créer des événements dans un calendrier que vous configurez à l'aide de la syntaxe populaire Unix cron. En surveillant ces événements, vous pouvez mettre en œuvre une application programmée.

CloudWatch Events est un flux d'événements de système quasiment en temps réel qui décrit les modifications apportées à vos ressources AWS. Avec CloudWatch Events, vous pouvez définir des règles pour surveiller des événements particuliers et effectuer des actions de manière automatisée. AWS CloudTrail est un service qui enregistre les appels d'API pour votre compte AWS et transmet les fichiers journaux contenant les appels d'API à votre bucket (compartiment) Amazon S3 ou un journal de groupe CloudWatch Logs. Avec AWS CloudTrail, vous pouvez rechercher l'historique des activités d'API liées à la création, la suppression et la modification de ressources AWS, et résoudre les problèmes opérationnels ou de sécurité.

AWS Config est un service entièrement géré qui vous offre un inventaire des ressources AWS, un historique de la configuration et des notifications de modification de la configuration pour assurer la sécurité et une bonne gestion. Config Rules vous permet de déterminer si les modifications de configuration sont conformes. CloudWatch Events réagit quasiment en temps réel aux changements d'état des ressources. Le service ne se prononce pas quant à la conformité des modifications avec la politique et ne fournit pas non plus un historique détaillé comme le font les fonctions Config/Config Rules. Il s'agit d'un flux d'événements à usage général.