Collecte

Collecte et stockage des journaux en toute simplicité

Le service Amazon CloudWatch Logs vous permet de collecter et de stocker les journaux de vos ressources, applications et services, et ce presque en temps réel. Il existe trois catégories principales de journaux :

1) Journaux payants. Ils sont initialement publiés par les services AWS à votre demande. Actuellement, les journaux de flux d'Amazon VPC et les journaux d'Amazon Route 53 sont les deux types pris en charge.

2) Journaux publiés par les services AWS. Actuellement, plus de 30 services AWS publient des journaux sur CloudWatch. Ces services comprennent Amazon API Gateway, AWS Lambda, AWS CloudTrail, et bien d'autres encore.

3) Journaux personnalisés. Ces journaux viennent de vos propres ressources d'application et de ressources sur site.

Vous pouvez utiliser AWS Systems Manager pour installer un agent CloudWatch ou utiliser l'action API PutLogData pour publier facilement des journaux.

Collectez et agrégez les métriques de l'infrastructure et des applications

Amazon CloudWatch vous permet de collecter les métriques d'infrastructure de plus de 70 services AWS, notamment Amazon Elastic Compute Cloud (Amazon EC2), Amazon DynamoDB, Amazon Simple Storage Service (Amazon S3), Amazon ECS, AWS Lambda et Amazon API Gateway, sans aucune intervention de votre part. Par exemple, les instances Amazon EC2 publient automatiquement les métriques relatives à l'utilisation du CPU, au transfert des données et à l'utilisation du disque, afin de vous aider à comprendre les changements d'état. Vous pouvez utiliser les métriques incluses pour API Gateway afin de détecter la latence ou tirer parti des métriques intégrées pour AWS Lambda dans le but de détecter les erreurs et les accélérateurs. De la même manière, Amazon CloudWatch vous permet de collecter les métriques de vos propres applications (telles que l'activité des utilisateurs, les métriques d'erreurs ou la mémoire utilisée) afin de surveiller les performances opérationnelles, de résoudre les problèmes et de repérer les tendances. Vous pouvez utiliser un agent CloudWatch ou l'appel de service de l'API PutMetricData afin de publier ces métriques sur CloudWatch. Si vous avez besoin de métriques plus détaillées en plus des métriques d'infrastructure par défaut, telles que des métriques Amazon Kinesis Data Streams au niveau des partitions, vous pouvez simplement vous inscrire par ressource. De même, les métriques d'application sont disponibles à une fréquence allant jusqu'à une seconde et peuvent être utilisées dans des statistiques, des graphiques et des alarmes avec une haute résolution.

Collecte et regroupement des métriques et journaux de conteneurs

Container Insights simplifie la collecte et le regroupement des métriques organisées et des journaux d’un écosystème de conteneurs. Il collecte sous forme d'événements de performances les métriques relatives aux performances de calcul, par exemple les informations sur le CPU, la mémoire, le réseau et le disque sur chaque conteneur, et génère automatiquement des métriques personnalisées à des fins de surveillance et d'alarme. Les événements de performances sont ingérés sous forme de journaux CloudWatch Logs avec des métadonnées concernant l'environnement en cours d'exécution, notamment l'identifiant de l'instance Amazon EC2, le service, le montage et l'identifiant du volume Amazon Elastic Block Store (Amazon EBS), afin de simplifier la résolution des problèmes et la surveillance. Les métriques personnalisées CloudWatch sont automatiquement extraites des journaux ainsi ingérés, et peuvent faire l'objet d'une analyse ultérieure via le langage de requête avancé de CloudWatch Logs Insights. Container Insights permet également de collecter des journaux d'applications (stdout/stderr), des journaux personnalisés, des journaux d'instances Amazon EC2 prédéfinies, des journaux de plans de données Amazon EKS/k8s et des journaux de plans de contrôle Amazon EKS. Pour les clusters Amazon EKS et k8s, vous pouvez utiliser un agent FluentD préconfiguré pour collecter vos journaux. Pour en savoir plus, consultez la documentation sur la configuration des journaux Container Insights. Pour Amazon ECS, vous pouvez utiliser le pilote de journalisation Amazon CloudWatch Logs ou Fluent Bit pour collecter les journaux d'applications.

Collecter et agréger les métriques et les journaux Lambda

CloudWatch Lambda Insights simplifie la collecte et l'agrégation des métriques et des journaux conservés à partir des fonctions AWS Lambda. Il collecte des métriques de performance de calcul telles que le CPU, la mémoire et le réseau de chaque fonction Lambda en tant qu'événements de performance, tout en générant automatiquement des métriques personnalisées utilisées pour la surveillance et l'alarme. Les événements de performance sont ingérés sous forme de CloudWatch Logs aux fins de la simplification de la surveillance et du dépannage. Les métriques personnalisées CloudWatch sont automatiquement extraites des journaux ainsi ingérés, et peuvent faire l'objet d'une analyse ultérieure via le langage de requête avancé de CloudWatch Logs Insights. Pour plus d'informations, consultez la documentation de démarrage de Lambda Insights.

Métriques Stream

Amazon CloudWatch Metric Streams vous permet de créer, presque en temps réel, des flux continus de métriques vers une destination de votre choix. L'envoi de métriques CloudWatch à des fournisseurs de service tiers à l'aide d'un point de terminaison HTTP Amazon Kinesis Data Firehose est ainsi facilité. Vous pouvez créer un flux continu et évolutif qui inclut les données métriques CloudWatch les plus récentes afin d'alimenter les tableaux de bord, les alarmes et tout autre outil reposant sur des données métriques précises et à jour. Dirigez facilement vos métriques vers votre lac de données sur AWS tel qu'Amazon S3, et commencez à analyser l'utilisation ou les performances avec des outils tels qu'Amazon Athena.

Contrôle

Vue opérationnelle unifiée avec tableaux de bord

Les tableaux de bord d'Amazon CloudWatch vous permettent de créer des graphiques réutilisables, ainsi que de visualiser vos ressources et applications cloud dans une vue unifiée. Vous pouvez présenter sous forme de graphique les métriques et les données des journaux côte à côte dans un tableau de bord unique afin d'obtenir rapidement du contexte. Vous pourrez ainsi passer du diagnostic du problème à la compréhension de la cause racine. Par exemple, vous pouvez visualiser les métriques clés, comme l'utilisation du CPU et la mémoire, et les comparer à la capacité. Vous pouvez également mettre en corrélation le modèle de journal d'une métrique donnée et paramétrer des alarmes pour être alerté en cas de problèmes de performance et opérationnels. Vous pouvez ainsi connaître l'état de santé opérationnelle à l'échelle du système et être en mesure de résoudre rapidement les problèmes, réduisant par là-même le temps moyen de résolution (MTTR).

Alarmes composites

Les alarmes composites Amazon CloudWatch vous permettent de combiner plusieurs alarmes et réduire leur bruit. Si un problème affecte plusieurs ressources d'une application, vous recevez une seule notification d'alarme pour l'application dans sa globalité au lieu d'une pour chaque ressource affectée. Ainsi, vous pouvez vous concentrer sur la recherche de la cause racine des problèmes opérationnels afin de réduire les temps d'arrêt des applications. Vous pouvez fournir un état général pour un regroupement de ressources comme une application, une région AWS ou une zone de disponibilité.

Alarmes haute résolution

Les alarmes Amazon CloudWatch vous permettent de paramétrer un seuil par rapport aux métriques et de déclencher une action. Vous pouvez créer des alarmes haute résolution, paramétrer un percentile comme statistique et spécifier une action ou ignorer si approprié. Par exemple, vous pouvez créer des alarmes pour les métriques Amazon EC2, paramétrer des notifications et réaliser une ou plusieurs actions afin de détecter et d'arrêter les instances non utilisées ou sous-utilisées. L'alarme en temps réel par rapport aux métriques et aux événements vous permet de minimiser les temps d'arrêt et l'impact potentiel sur les activités.

Corrélation entre les journaux et les métriques

Les applications et les ressources d'infrastructure génèrent de grands volumes de données opérationnelles et de surveillance sous forme de journaux et de métriques. En plus de vous permettre d'accéder à ces ensembles de données et de les visualiser sur une plateforme unique, Amazon CloudWatch facilite leur corrélation. Cela vous aide à passer rapidement du diagnostic du problème à la compréhension de la cause première. Par exemple, vous pouvez corréler un modèle de journal, tel qu'une erreur par rapport à une métrique spécifique, et paramétrer les alarmes pour être alerté des problèmes opérationnels et de performance.

Application Insights

L'application Amazon CloudWatch Insights fournit une configuration automatisée de l'observabilité de vos applications métier pour vous permettre d'en connaître l'état de santé. Elle vous aide à trouver et configurer des métriques et des journaux clés sur vos ressources d'application et votre pile technologique, comme les bases de données, les serveurs Web (IIS) et d'applications, le système d'exploitation, les équilibreurs de charge et les files d'attente. Elle surveille en permanence ces données de télémétrie afin de détecter et de corréler les anomalies et les erreurs, et de vous signaler tout problème concernant votre application. Pour faciliter le dépannage, elle crée des tableaux de bord automatisés qui retracent les problèmes détectés, les anomalies métriques, les erreurs de journalisation corrélées, ainsi que des informations supplémentaires vous indiquant la cause potentielle. Vous pouvez alors prendre rapidement des mesures correctives pour vous assurer que vos applications sont saines et que les utilisateurs finaux ne sont pas affectés.

Informations relatives à la surveillance des conteneurs

Container Insights génère des tableaux de bord automatiques dans la console CloudWatch. Ces tableaux de bord récapitulent les performances de calcul, les erreurs et les alarmes par cluster, pod/tâche et service. En ce qui concerne Amazon EKS et k8s, les tableaux de bord sont également disponibles pour les nœuds/instances EC2 et les espaces de noms. Chaque tableau de bord résume la liste des pods/tâches ou conteneurs en cours d'exécution par CPU et mémoire pour la fenêtre de temps sélectionnée. Vous pouvez explorer en détail les journaux d'application, les traces AWS X-Ray et les événements de performance de manière contextuelle, en fonction de la fenêtre de temps et du pod/tâche ou conteneur sélectionné.

Informations relatives à la surveillance avec Lambda

Lambda Insights génère des tableaux de bord automatiques dans la console CloudWatch. Ces tableaux de bord résument les performances et les erreurs de calcul. Chaque tableau de bord comprend la liste des métriques pour la fenêtre temporelle sélectionnée et vous permet de faire une exploration contextuelle plus approfondie (en fonction de la fenêtre temporelle et de la fonction sélectionnée) dans les journaux d'application, les traces AWS X-Ray et les événements de performance.

Détection des anomalies

La détection des anomalies Amazon CloudWatch applique des algorithmes de machine learning (ML) pour analyser en continu les données de métrique et identifier un comportement anormal. Elle permet de créer des alarmes qui ajustent automatiquement les seuils en fonction de modèles de métriques naturels, tels que l'heure du jour, la saisonnalité du jour de la semaine ou les tendances changeantes. Vous pouvez également visualiser des métriques avec des bandes de détection d'anomalies sur les tableaux de bord. Cela vous permet de surveiller, d'isoler et de résoudre les changements inattendus dans vos métriques.

ServiceLens

Vous pouvez utiliser Amazon CloudWatch ServiceLens pour visualiser et analyser l'état, les performances et la disponibilité de vos applications en un lieu unique. Cette application relie les métriques et les journaux CloudWatch, ainsi que les traces provenant d'AWS X-Ray pour vous donner une vue complète de vos applications et de leurs dépendances. Vous pouvez ainsi identifier rapidement les goulots d'étranglement en matière de performance, isoler les causes profondes des problèmes d'application et déterminer l'impact sur les utilisateurs. CloudWatch ServiceLens vous permet de gagner en visibilité sur vos applications dans trois domaines principaux : la surveillance de l'infrastructure (au moyen de métriques et de journaux, pour comprendre les ressources qui prennent en charge vos applications), la surveillance des transactions (au moyen de traces, pour comprendre les dépendances entre vos ressources), et la surveillance des utilisateurs finaux (au moyen de scripts canaris, pour surveiller vos points de terminaison et vous avertir lorsque l'expérience des utilisateurs finaux s'est dégradée). CloudWatch ServiceLens fournit une carte de services qui visualise la liaison contextuelle de toutes vos ressources, ainsi qu'une interface intuitive vous permettant de plonger dans les données de surveillance corrélées.

Synthetics

Amazon CloudWatch Synthetics vous permet de surveiller plus facilement les points de terminaison d'applications. Elle exécute des tests sur vos points de terminaison 24 heures sur 24 et 7 jours sur 7, et vous alerte s'ils ne se comportent pas comme prévu. Ces tests peuvent être personnalisés pour vérifier la disponibilité, la latence, les transactions, les liens rompus ou morts, la réalisation de tâches étape par étape, les erreurs de chargement de page, les latences de chargement des ressources de l'interface utilisateur, les flux d'assistants complexes ou les flux de sortie de vos applications. Vous pouvez également utiliser CloudWatch Synthetics pour isoler les points de terminaison d'applications alarmants et les associer aux problèmes d'infrastructure sous-jacents afin de réduire le délai moyen de récupération (MTTR). Avec cette nouvelle fonctionnalité, CloudWatch collecte désormais le trafic des versions Canary, ce qui permet de vérifier en continu votre expérience client même en l'absence de trafic client sur vos applications. Ainsi, vous détectez les problèmes rapidement, avant vos clients. CloudWatch Synthetics prend en charge la surveillance de vos API REST, de vos URL et du contenu de votre site Web, en recherchant les modifications non autorisées apportées par des opérations de phishing, l'injection de code et les scripts intersite.

RUM

Amazon CloudWatch RUM vous donne une visibilité sur les performances de vos applications côté client et réduit le délai moyen de récupération (MTTR). Elle vous permet de collecter des données côté client sur les performances des applications web en temps quasi réel afin d'identifier et de déboguer les problèmes. CloudWatch RUM complète les données de CloudWatch Synthetics pour vous donner plus de visibilité sur l'expérience de l'utilisateur final. Vous pouvez visualiser les anomalies de performance et utiliser les données de débogage pertinentes (telles que les messages d'erreur, les traces de pile et les sessions utilisateur) pour résoudre les problèmes de performance (tels que les erreurs JavaScript, les plantages et les latences). Vous pouvez avoir un aperçu de l'éventail des impacts sur les utilisateurs finaux, notamment le nombre d'utilisateurs, les géolocalisations et les navigateurs. CloudWatch RUM rassemble des données sur le parcours de vos utilisateurs dans votre application, ce qui peut vous aider à déterminer les fonctions à lancer et les corrections de bogues à privilégier.

Agir

Auto Scaling

Auto Scaling vous aide à automatiser la planification des capacités et des ressources. Vous pouvez paramétrer un seuil pour une alarme par rapport à une métrique clé et déclencher une action Auto Scaling automatisée. Par exemple, vous pouvez paramétrer un flux de travail Auto Scaling pour ajouter ou retirer des instances EC2 basées sur les métriques d'utilisation du CPU et optimiser les coûts de ressource.

Réponse automatique aux changements opérationnels avec CloudWatch Events

CloudWatch Events offre un flux d'événements de système quasiment en temps réel qui décrit les modifications apportées à vos ressources AWS. Il vous permet de répondre rapidement aux changements opérationnels et de prendre des mesures correctives. Il vous suffit d'écrire des règles pour indiquer quels événements présentent un intérêt pour votre application et quelles actions automatiques doivent être réalisées lorsqu'une règle correspond à un événement. Vous pouvez, par exemple, paramétrer une règle pour appeler des fonctions AWS Lambda ou notifier une rubrique Amazon Simple Notification Service (Amazon SNS).

Alarmes et automatisation d'actions sur les clusters EKS, ECS et k8s

S'agissant des clusters Amazon EKS et k8s, Container Insights vous permet de définir des alarmes pour vos métriques de calcul afin de déclencher des politiques Auto Scaling sur votre groupe Amazon EC2 Auto Scaling, mais aussi d'arrêter, résilier, redémarrer et récupérer n'importe quelle instance Amazon EC2. Pour les clusters Amazon ECS, vous pouvez utiliser les métriques de calcul associées à vos tâches et services pour Service Auto Scaling.  

Analyse

Données précises et rétention étendue

Amazon CloudWatch vous permet de surveiller les tendances et les variations saisonnières avec 15 mois de données de métrique (stockage et rétention). Ces données vous permettent de réaliser une analyse de l'historique afin d'ajuster l'utilisation des ressources. Avec CloudWatch, vous pouvez également collecter jusqu'à 1 seconde de métriques de santé, y compris les métriques personnalisées, comme celles venant de vos applications sur site. Les données précises en temps réel permettent d'obtenir une meilleure visualisation et la possibilité d'identifier et de surveiller les tendances afin d'optimiser la performance et la santé opérationnelle des applications.

Opérations personnalisées sur les métriques

Amazon CloudWatch Metric Math vous permet de réaliser des calculs avec diverses métriques pour des analyses en temps réel, afin que vous obteniez des informations provenant de vos métriques CloudWatch existantes et mieux comprendre la santé opérationnelle ainsi que la performance de votre infrastructure. Vous pouvez visualiser ces métriques calculées dans la Console de gestion AWS, les ajouter aux tableaux de bord CloudWatch ou les extraire en utilisant l'action API GetMetricData. Metric Math prend en charge des opérations arithmétiques (comme +, -, /, *) et des fonctions mathématiques (comme Somme, Moyenne, Min, Max et Écart-type).

Analyse des fichiers journaux

Amazon CloudWatch Logs Insights vous permet de récupérer des informations utiles depuis vos journaux pour résoudre des problèmes d’exploitation sans avoir à fournir aucun serveur ou à gérer les logiciels.. Vous pouvez aussitôt commencer à écrire des requêtes avec des agrégations, des filtres et des expressions régulières. Vous pouvez également visualiser des données de séries chronologiques, faire des recherches dans les événements du journal et exporter les résultats de requêtes vers CloudWatch Dashboards. Vous obtenez ainsi une visibilité opérationnelle complète. En seulement quelques clics sur la Console de gestion AWS, vous pouvez commencer à utiliser Logs Insights pour demander des journaux envoyés à CloudWatch. Vous ne payez que les requêtes que vous exécutez.

Analyse des métriques, journaux et traces de conteneurs

Container Insights facilite l'analyse des données observables provenant des métriques, journaux et traces. Pour ce faire, il simplifie les liens profonds entre les tableaux de bord automatiques et les événements de performances, les journaux d'applications (stdout/stderr), les journaux personnalisés, les journaux d'instances Amazon EC2 prédéfinies, les journaux de plans de données Amazon EKS/k8s et les journaux de plans de contrôle Amazon EKS détaillés en utilisant le langage de requête avancé de CloudWatch Logs Insights.

Analyser des métriques, journaux et traces de Lambda

Lambda Insights simplifie l'analyse des données observables à partir de métriques, de journaux et de traces en établissant des liens profonds entre les tableaux de bord automatiques et les événements de performance granulaires, les journaux d'application et les journaux personnalisés, grâce au langage de requête avancé de CloudWatch Logs Insights.

Contributor Insights

Amazon CloudWatch inclut désormais Contributor Insights, qui analyse les données chronologiques afin de fournir une vue des principaux contributeurs ayant une incidence sur les performances du système. Une fois la configuration effectuée, Contributor Insights fonctionne en continu sans intervention supplémentaire de l'utilisateur. Cela aide les développeurs et les opérateurs à isoler, diagnostiquer et résoudre les problèmes plus rapidement lors d'un événement opérationnel. Contributor Insights vous aide à repérer les personnes ou les choses qui ont une incidence sur les performances de votre système, comme une ressource spécifique, un compte client ou appel d'API. Cela vous permet d'identifier les valeurs aberrantes, de trouver les modèles de trafic les plus lourds et de classer les processus système les plus utilisés. Vous pouvez créer des règles Contributor Insights pour évaluer des modèles dans des événements de journal structurés lors du transfert vers CloudWatch Logs, dont les journaux de services AWS comme AWS CloudTrail, Amazon Virtual Private Cloud (Amazon VPC), Amazon API Gateway et tous les journaux personnalisés envoyés par vos serveurs sur site ou votre service, comme les journaux d'accès Apache. Contributor Insights évalue ces événements de journal en temps quasi réel et affiche des rapports indiquant les principaux contributeurs et le nombre de contributeurs uniques dans un ensemble de données. Un contributeur est une métrique agrégée basée sur des dimensions contenues dans des champs de journal sur CloudWatch Logs, comme « id-compte » ou « id-interface » dans les journaux de flux VPC, ou tout autre ensemble de dimensions personnalisé. Vous pouvez trier et filtrer les données des contributeurs en fonction de vos propres critères. Les données du rapport de Contributor Insights peuvent être affichées sur des tableaux de bord CloudWatch, représentées sous la forme d'un graphique accompagné des métriques CloudWatch et ajoutées aux alarmes CloudWatch.

Metrics Insights

Amazon CloudWatch Metrics Insights est un moteur de requête SQL rapide et flexible qui vous permet d'identifier des tendances et des modèles dans des millions de métriques opérationnelles en temps quasi réel. Metrics Insights vous permet d'avoir une meilleure visibilité des performances de votre infrastructure et de vos applications à grande échelle grâce à des traitements de requêtes flexibles et à des agrégations de métriques à la volée. Les requêtes Metrics Insights peuvent être utilisées pour créer des visualisations puissantes, vous aidant à surveiller et à localiser rapidement les problèmes de manière proactive, et à réduire le délai moyen de récupération (MTTR). 

Evidently

Amazon CloudWatch Evidently permet aux développeurs d'applications de mener des expériences et d'identifier les conséquences involontaires des nouvelles fonctions avant de les déployer pour un usage général, réduisant ainsi les risques liés au déploiement de nouvelles fonctions. Evidently vous permet de valider les nouvelles fonctions sur l'ensemble de la pile d'applications avant la publication, pour plus de sécurité. Lorsque vous lancez de nouvelles fonction, vous pouvez les exposer à une petite base d'utilisateurs, surveiller les mesures clés telles que les temps de chargement des pages ou les conversions, puis augmenter le trafic. Evidently vous permet également d'essayer différentes conceptions, de recueillir des données sur les utilisateurs et de mettre en production la conception la plus efficace. 

Conformité et sécurité

Amazon CloudWatch est associé à AWS Identity and Access Management (IAM) afin que vous puissiez contrôler quels utilisateurs et quelles ressources peuvent accéder à vos données et comment.

Amazon CloudWatch Logs est également compatible avec PCI et FedRamp. Les ressources sont chiffrées au repos et en transit. Vous pouvez également utiliser le chiffrement AWS Key Management Service (AWS KMS) pour chiffrer vos groupes de journaux afin de renforcer la conformité et la sécurité.

En savoir plus sur la tarification d'Amazon CloudWatch

Visiter la page de tarification
Prêt à concevoir ?
Mise en route d'Amazon CloudWatch
D'autres questions ?
Nous contacter