Collecte

Collecte et stockage des journaux en toute simplicité

Le service Amazon CloudWatch Logs vous permet de collecter et de stocker les journaux de vos ressources, applications et services, et ce presque en temps réel. Il existe trois catégories principales de journaux : 1) Les journaux payants. Ils sont initialement publiés par les services AWS à la demande du client. Actuellement, les journaux de flux d'Amazon VPC et les journaux d'Amazon Route 53 sont les deux types pris en charge. 2) Les journaux qui sont publiés par les services AWS. Actuellement, plus de 30 services AWS publient des journaux sur CloudWatch. Ces services comprennent Amazon API Gateway, AWS Lambda, AWS CloudTrail, et bien d'autres encore. 3) Journaux personnalisés. Ces journaux viennent de vos propres ressources d'application et de ressources sur site. Vous pouvez utiliser AWS Systems Manager pour installer un agent CloudWatch ou utiliser l'action API PutLogData pour publier facilement des journaux.

Métriques intégrées

La collecte des métriques des applications distribuées (comme celles conçues en utilisant des architectures de microservices) est chronophage. Amazon CloudWatch vous permet de collecter les métriques par défaut de plus de 70 services AWS, notamment Amazon EC2, Amazon DynamoDB, Amazon S3, Amazon ECS, AWS Lambda et Amazon API Gateway, sans aucune intervention de votre part. Par exemple, les instances EC2 publient automatiquement les métriques relatives à l'utilisation du CPU, au transfert des données et à l'utilisation du disque, afin de vous aider à comprendre les changements d'état. Vous pouvez utiliser l'une des sept métriques incluses pour API Gateway afin de détecter la latence ou tirer parti de l'une des huit métriques intégrées pour AWS Lambda dans le but de détecter les erreurs et les accélérateurs. Si vous avez besoin de métriques plus détaillées en plus des métriques par défaut, telles que des métriques Amazon Kinesis Data Streams au niveau des partitions, alors vous pouvez simplement vous inscrire par ressource.

Métriques personnalisées

Amazon CloudWatch vous permet de collecter des métriques personnalisées depuis vos propres applications afin de surveiller la performance opérationnelle, de résoudre les problèmes et de repérer les tendances. L'activité utilisateur est un exemple de métrique personnalisée que vous pouvez collecter et surveiller sur une période de temps. Vous pouvez utiliser un agent CloudWatch ou l'action de l'API PutMetricData afin de publier ces métriques sur CloudWatch. Toutes les fonctionnalités CloudWatch identiques seront disponibles jusqu'à une fréquence d'une seconde pour vos propres données de métriques personnalisées, y compris les statistiques, les graphiques et les alarmes.

Collecte et regroupement des métriques et journaux de conteneurs

Container Insights simplifie la collecte et le regroupement des métriques organisées et des journaux d’un écosystème de conteneurs. Il collecte sous forme d’événements de performances les métriques relatives aux performances de calcul, par exemple les informations sur le CPU, la mémoire, le réseau et le disque sur chaque conteneur, et génère automatiquement des métriques personnalisées à des fins de surveillance et d’alarme. Les événements de performances sont ingérés sous forme de journaux CloudWatch Logs avec des métadonnées concernant l’environnement en cours d’exécution, notamment l’identifiant de l’instance Amazon EC2, le service, le montage et l’identifiant de volume Amazon EBS, etc. afin de simplifier la résolution des problèmes et la surveillance. Les métriques personnalisées CloudWatch sont automatiquement extraites des journaux ainsi ingérés, et peuvent faire l’objet d’une analyse ultérieure via le langage de requête avancé de CouldWatch Logs Insights. Container Insights permet également de collecter des journaux d’applications (stdout/stderr), des journaux personnalisés, des journaux d’instances Amazon EC2 prédéfinies, des journaux de plans de données Amazon EKS/k8s et des journaux de plans de contrôle Amazon EKS. Pour les clusters Amazon EKS et k8s, vous pouvez utiliser un agent FluentD préconfiguré pour collecter vos journaux. Pour en savoir plus, consultez la documentation sur la configuration des journaux Container Insights. Pour Amazon ECS, vous pouvez utiliser le pilote de journalisation Amazon CloudWatch Logs ou Fluent Bit pour collecter les journaux d'applications.

Collecter et agréger les métriques et les journaux Lambda

CloudWatch Lambda Insights simplifie la collecte et l'agrégation des métriques et des journaux conservés à partir des fonctions AWS Lambda. Il collecte des métriques de performance de calcul telles que le CPU, la mémoire et le réseau de chaque fonction Lambda en tant qu'événements de performance, tout en générant automatiquement des métriques personnalisées utilisées pour la surveillance et l'alarme. Les événements de performance sont ingérés sous forme de CloudWatch Logs aux fins de la simplification de la surveillance et du dépannage. Les métriques personnalisées CloudWatch sont automatiquement extraites des journaux ainsi ingérés, et peuvent faire l'objet d'une analyse ultérieure via le langage de requête avancé de CloudWatch Logs Insights. Consultez la documentation de démarrage de Lambda Insights pour plus d'informations.

Contrôle

Vue opérationnelle unifiée avec tableaux de bord

Les tableaux de bord d'Amazon CloudWatch vous permettent de créer des graphiques réutilisables, ainsi que de visualiser vos ressources et applications cloud dans une vue unifiée. Vous pouvez présenter sous forme de graphique les métriques et les données des journées côte à côte dans un tableau de bord unique afin d'obtenir rapidement le contexte. Cela vous permet de passer du diagnostic du problème à la compréhension de la cause racine. Par exemple, vous pouvez visualiser les métriques clés, comme l'utilisation du CPU et la mémoire, et les comparer à la capacité. Vous pouvez également mettre en corrélation le modèle de journal d'une métrique spécifique et paramétrer des alarmes pour être alerté de façon proactive sur les problèmes de performance et opérationnels. Cela vous offre une visibilité à l'échelle du système pour la santé opérationnelle et la capacité de résoudre rapidement les problèmes, réduisant le temps moyen de résolution (MTTR).

Alarmes composites

Les alarmes composites Amazon CloudWatch vous permettent de combiner plusieurs alarmes et réduire leur bruit. Si un problème d'application affecte plusieurs ressources dans une application, vous recevez une seule notification d'alarme pour l'application entière au lieu d'une pour chaque composant de service ou ressource affectés. Ainsi, vous pouvez vous concentrer sur la recherche de la cause racine des problèmes opérationnels afin de réduire les temps d'arrêt des applications. Vous pouvez fournir un état général pour un regroupement de ressources comme une application, une région AWS ou une zone de disponibilité.

Alarmes haute résolution

Les alarmes Amazon CloudWatch vous permettent de paramétrer un seuil par rapport aux métriques et de déclencher une action. Vous pouvez créer des alarmes haute résolution, paramétrer un percentile comme statistique et spécifier une action ou ignorer si approprié. Par exemple, vous pouvez créer des alarmes pour les métriques Amazon EC2, paramétrer des notifications et réaliser une ou plusieurs actions afin de détecter et d'arrêter les instances non utilisées ou sous-utilisées. L'alarme en temps réel par rapport aux métriques et aux événements vous permet de minimiser les temps d'arrêt et l'impact potentiel sur les activités.

Corrélation entre les journaux et les métriques

Les applications et les ressources d'infrastructure génèrent de nombreuses données opérationnelles et de surveillance sous forme de journaux et de métriques. En plus d'offrir la possibilité d'accéder à ces ensembles de données et de les visualiser sur une plateforme unique, Amazon CloudWatch facilite la corrélation entre les métriques et les journaux. Cela vous aide à passer rapidement du diagnostic du problème à la compréhension de la cause première. Par exemple, vous pouvez corréler un modèle de journal, tel qu'une erreur par rapport à une métrique spécifique, et paramétrer les alarmes pour être alerté activement des problèmes opérationnels et de performance.

Application Insights pour .NET et applications SQL Server

Amazon CloudWatch Application Insights pour .NET et SQL Server vous permet de surveiller aisément les applications .NET et SQL Server afin d’avoir une visibilité sur leur état. Il vous aide à trouver et configurer des métriques et des journaux clés sur vos ressources d’application et votre pile technologique, c.-à-d. les bases de données, serveurs Web (IIS) et d’applications, système d’exploitation, équilibreurs de charge, files d’attente, etc. Il surveille en permanence ces données de télémétrie afin de détecter et de corréler les anomalies et les erreurs, et de vous signaler tout problème concernant votre application. Pour faciliter le dépannage, il crée des tableaux de bord automatisés qui retracent les problèmes détectés, les anomalies métriques, les erreurs de journalisation corrélées, ainsi que des informations supplémentaires vous indiquant la cause potentielle. Vous pouvez alors prendre rapidement des mesures correctives pour vous assurer que vos applications sont saines et que les utilisateurs finaux ne sont pas affectés.

Informations relatives à la surveillance des conteneurs

Container Insights génère des tableaux de bord automatiques dans la console CloudWatch. Ces tableaux de bord récapitulent les performances de calcul, les erreurs et les alarmes par cluster, pod/tâche et service. En ce qui concerne Amazon EKS et k8s, les tableaux de bord sont également disponibles pour les nœuds/instances EC2 et les espaces de noms. Chaque tableau de bord récapitule la liste des pods/tâches ou conteneurs en cours d'exécution par CPU et par mémoire pour la période sélectionnée, et vous permet d'effectuer une analyse contextuelle – en fonction de la période sélectionnée et du pod/de la tâche ou du conteneur sélectionnés – dans les journaux des applications, les suivis AWS X-Ray et les événements de performances. 

Informations relatives à la surveillance avec Lambda

Lambda Insights génère des tableaux de bord automatiques dans la console CloudWatch. Ces tableaux de bord résument les performances et les erreurs de calcul. Chaque tableau de bord comprend la liste des métriques pour la fenêtre temporelle sélectionnée et vous permet de faire une exploration contextuelle plus approfondie – en fonction de la fenêtre temporelle et de la fonction sélectionnée – dans les journaux d'application, les traces AWS X-Ray et les événements de performance.

Détection des anomalies

La détection des anomalies Amazon CloudWatch applique des algorithmes de machine learning pour analyser en continu les données d'une métrique et identifier un comportement anormal. Elle permet de créer des alarmes qui ajustent automatiquement les seuils en fonction de modèles de mesures naturels, tels que l'heure du jour, la saisonnalité du jour de la semaine ou les tendances changeantes. Vous pouvez également visualiser des métriques avec des bandes de détection d'anomalies sur les tableaux de bord. Cela vous permet de surveiller, d'isoler et de résoudre les changements inattendus dans vos métriques.

ServiceLens

Vous pouvez utiliser Amazon CloudWatch ServiceLens pour visualiser et analyser l’état, les performances et la disponibilité de vos applications en un lieu unique. CloudWatch ServiceLens relie les métriques et les journaux CloudWatch, ainsi que les traces provenant d’AWS X-Ray pour vous donner une vue complète de vos applications et de leurs dépendances. Cela vous permet d'identifier rapidement les goulots d'étranglement en matière de performance, d'isoler les causes profondes des problèmes d’application et de déterminer l’impact sur les utilisateurs. CloudWatch ServiceLens vous permet de gagner en visibilité sur vos applications dans trois domaines principaux : la surveillance de l'infrastructure (au moyen de métriques et de journaux, pour comprendre les ressources qui prennent en charge vos applications), la surveillance des transactions (au moyen de traces, pour comprendre les dépendances entre vos ressources), et la surveillance des utilisateurs finaux (au moyen de scripts canaris, pour surveiller vos points de terminaison et vous avertir lorsque l’expérience des utilisateurs finaux s’est dégradée). CloudWatch ServiceLens fournit une carte de services qui visualise la liaison contextuelle de toutes vos ressources, ainsi qu'une interface intuitive vous permettant de plonger dans les données de surveillance corrélées.

Synthetics

Amazon CloudWatch Synthetics vous permet de surveiller plus facilement les points de terminaison d'applications. CloudWatch Synthetics teste vos points de terminaison toutes les minutes, 24 heures sur 24, 7 jours sur 7 et vous avertit dès que les points de terminaison de votre application ont un comportement anormal. Ces tests peuvent être personnalisés pour vérifier la disponibilité, la latence, les transactions, les liens rompus ou morts, la réalisation de tâches étape par étape, les erreurs de chargement de page, les latences de chargement des ressources de l'interface utilisateur, les flux d'assistants complexes ou les flux de sortie de vos applications. Vous pouvez également utiliser CloudWatch Synthetics pour isoler les points de terminaison d'applications alarmants et les associer aux problèmes d'infrastructure sous-jacents afin de réduire le délai moyen de résolution. Avec cette nouvelle fonctionnalité, CloudWatch collecte désormais le trafic des versions Canary, ce qui permet de vérifier en continu votre expérience client même lorsque vous n'avez aucun trafic client sur vos applications. Ainsi, vous détectez les problèmes rapidement, avant vos clients. CloudWatch Synthetics prend en charge la surveillance de vos API REST, de vos URL et du contenu de votre site Web, en recherchant les modifications non autorisées apportées par des opérations de phishing, l'injection de code et les scripts intersite.

Métriques Stream

Amazon CloudWatch Metric Streams vous permet de créer, presque en temps réel, des flux continus de métriques vers une destination de votre choix. Metric Streams facilite l'envoi de métriques CloudWatch à des fournisseurs de service tiers à l'aide d'un point de terminaison HTTP Amazon Kinesis Data Firehose. Vous pouvez créez un flux continu et évolutif qui inclut les données métriques CloudWatch les plus récentes afin d'alimenter les tableaux de bord, les alarmes et tout autre outil reposant sur des données métriques précises et à jour. Vous pouvez également diriger en toute facilité vos métriques vers votre data lake sur AWS tel qu'Amazon Simple Storage Service (S3), en prévision de l'analyse de l'utilisation ou des performances avec des outils tels qu'Amazon Athena.

Agir

Auto Scaling

Auto Scaling vous aide à automatiser la planification des capacités et des ressources. Vous pouvez paramétrer un seuil pour une alarme par rapport à une métrique clé et déclencher une action Auto Scaling automatisée. Par exemple, vous pouvez paramétrer un flux de travail Auto Scaling pour ajouter ou retirer des instances EC2 basées sur les métriques d'utilisation du CPU et optimiser les coûts de ressource.

Réponse automatique aux changements opérationnels avec CloudWatch Events

CloudWatch Events offre un flux d'événements de système quasiment en temps réel qui décrit les modifications apportées à vos ressources AWS. Il vous permet de répondre rapidement aux changements opérationnels et de prendre des mesures correctives. Il vous suffit d'écrire des règles pour indiquer quels événements présentent un intérêt pour votre application et quelles actions automatiques doivent être réalisées lorsqu'une règle correspond à un événement. Vous pouvez, par exemple, paramétrer une règle pour appeler des fonctions AWS Lambda ou notifier une rubrique Amazon Simple Notification Service (SNS).

Alarmes et automatisation d’actions sur les clusters EKS, ECS et k8s

S’agissant des clusters Amazon EKS et k8s, Container Insights vous permet de définir des alarmes pour vos métriques de calcul afin de déclencher des politiques Auto Scaling sur votre groupe Auto Scaling Amazon EC2, mais aussi d’arrêter, résilier, redémarrer et récupérer n’importe quelle instance Amazon EC2. Pour les clusters Amazon ECS, vous pouvez utiliser les métriques de calcul associées à vos tâches et services pour Service Auto Scaling.  

Analyse

Données précises et rétention étendue

Amazon CloudWatch vous permet de surveiller les tendances et les variations saisonnières avec 15 mois de données de métrique (stockage et rétention). Ces données vous permettent de réaliser une analyse de l'historique afin d'ajuster l'utilisation des ressources. Avec CloudWatch, vous pouvez également collecter jusqu'à 1 seconde de métriques de santé, y compris les personnalisées, comme celles venant de vos applications sur site. Les données précises en temps réel permettent d'obtenir une meilleure visualisation et la possibilité d'identifier et de surveiller les tendances afin d'optimiser la performance et la santé opérationnelle des applications.

Opérations personnalisées sur les métriques

Amazon CloudWatch Metric Math vous permet de réaliser des calculs avec diverses métriques pour des analyses en temps réel, afin que vous obteniez des informations provenant de vos métriques CloudWatch existantes et mieux comprendre la santé opérationnelle ainsi que la performance de votre infrastructure. Vous pouvez visualiser ces métriques calculées dans AWS Management Console, les ajouter aux tableaux de bord CloudWatch ou les extraire en utilisant l'action API GetMetricData. Metric Math prend en charge des opérations arithmétiques comme +, -, /, * et des fonctions mathématiques comme Somme, Moyenne, Min, Max et Écart-type.

Analyse des fichiers journaux

Amazon CloudWatch Logs Insights vous permet de récupérer des informations utiles depuis vos journaux pour résoudre des problèmes d’exploitation sans avoir à fournir aucun serveur ou à gérer les logiciels.. Vous pouvez aussitôt commencer à écrire des requêtes avec des agrégations, des filtres et des expressions régulières. Vous pouvez également visualiser des données de séries chronologiques, faire des recherches dans les événements de journaux individuels et exporter les résultats de requêtes vers CloudWatch Dashboards. Vous obtenez ainsi une visibilité opérationnelle complète. En seulement quelques clics sur l'AWS Management Console, vous pouvez commencer à utiliser Logs Insights pour demander des journaux envoyés à CloudWatch. Vous ne payez que pour les requêtes que vous exécutez.

Analyse des métriques, journaux et traces de conteneurs

Container Insights facilite l'analyse des données observables provenant des métriques, journaux et traces. Pour ce faire, il simplifie les liens profonds entre les tableaux de bord automatiques et les événements de performances, les journaux d'applications (stdout/stderr), les journaux personnalisés, les journaux d'instances Amazon EC2 prédéfinies, les journaux de plans de données Amazon EKS/k8s et les journaux de plans de contrôle Amazon EKS détaillés en utilisant le langage de requête avancé de CloudWatch Logs Insights.

Analyser des métriques, journaux et traces de Lambda

Lambda Insights simplifie l'analyse des données observables à partir de métriques, de journaux et de traces en établissant des liens profonds entre les tableaux de bord automatiques et les événements de performance granulaires, les journaux d'application et les journaux personnalisés, grâce au langage de requête avancé de CloudWatch Logs Insights.

Contributor Insights

Amazon CloudWatch inclut désormais Contributor Insights, qui analyse les données chronologiques afin de fournir une vue des principaux contributeurs ayant une incidence sur les performances du système. Une fois la configuration effectuée, Contributor Insights fonctionne en continu sans intervention supplémentaire de l'utilisateur. Cela aide les développeurs et les opérateurs à isoler, diagnostiquer et résoudre les problèmes plus rapidement lors d'un événement opérationnel. Contributor Insights vous aide à repérer les personnes ou les choses qui ont une incidence sur les performances de votre système, comme une ressource spécifique, un compte client ou appel d’API. Cela vous permet d’identifier les valeurs aberrantes, de trouver les modèles de trafic les plus lourds et de classer les processus système les plus utilisés. Vous pouvez créer des règles Contributor Insights pour évaluer des modèles dans des événements de journal structurés lors du transfert vers CloudWatch Logs, dont les journaux de services AWS comme AWS CloudTrail, Amazon Virtual Private Cloud, Amazon API Gateway et tous les journaux personnalisés envoyés par vos serveurs sur site ou votre service, comme les journaux d’accès Apache. Contributor Insights évaluera ces événements de journal en temps réel et affichera des rapports indiquant les principaux contributeurs et le nombre de contributeurs uniques dans un ensemble de données. Un contributeur est une métrique agrégée basée sur des dimensions contenues dans des champs de journal sur CloudWatch Logs, comme « id-compte » ou « id-interface » dans les journaux de flux VPC, ou tout autre ensemble de dimensions personnalisé. Vous pouvez trier et filtrer les données des contributeurs en fonction de vos propres critères. Les données du rapport de Contributor Insights peuvent être affichées sur des tableaux de bord CloudWatch, représentées sous la forme d'un graphique à côté des métriques CloudWatch et ajoutées aux alarmes CloudWatch.

Conformité et sécurité

Amazon CloudWatch est associé à AWS Identity and Access Management (IAM) afin que vous puissiez contrôler quels utilisateurs et quelles ressources peuvent accéder à vos données et comment.

Amazon CloudWatch Logs est également compatible avec PCI et FedRamp. Les données sont chiffrées au repos et lors du transfert. Vous pouvez également utiliser le chiffrement AWS KMS pour chiffrer vos groupes de journaux afin de renforcer la conformité et la sécurité.

En savoir plus sur la tarification d'Amazon CloudWatch

Visiter la page de tarification
Prêt à concevoir ?
Mise en route d'Amazon CloudWatch
D'autres questions ?
Contactez-nous