Amazon CloudWatch
Amazon CloudWatch est un service de surveillance et d'observabilité conçu pour les ingénieurs DevOps, les développeurs, les ingénieurs en fiabilité de sites (SRE) et les responsables informatiques. CloudWatch vous fournit des données et informations exploitables dont vous avez besoin pour surveiller vos applications, réagir aux variations de performance sur l’ensemble du système, optimiser l’utilisation des ressources et avoir une appréciation unifiée de la santé opérationnelle. CloudWatch collecte les données opérationnelles et de surveillance sous forme de journaux, de métriques et d’événements pour vous permettre d’avoir une appréciation unifiée des ressources, des applications et des services AWS exécutés sur AWS et sur des serveurs sur site. Vous pouvez utiliser CloudWatch pour déceler des comportements anormaux dans vos environnements, définir des alarmes, visualiser les journaux et les métriques côte à côte, agir automatiquement, faire des dépannages et trouver les informations utiles au bon
fonctionnement de vos applications.
Avantages
Observabilité sur une plate-forme unique sur l'ensemble des applications et de l'infrastructure
Les applications modernes à l’instar de celles qui s'exécutent sur des architectures de microservices génèrent de grands volumes de données sous forme de métriques, de journaux et d'événements. Amazon CloudWatch vous permet de collecter ces données, d'y accéder et de les corréler sur une plate-forme unique à partir de toutes vos ressources, applications et services AWS qui s'exécutent sur des serveurs AWS et sur site. Ainsi, vous avez la possibilité d’éclater les silos de données pour facilement gagner en visibilité sur l’ensemble du système et résoudre rapidement vos problèmes.
Le moyen le plus simple de collecter des métriques dans AWS et sur site
CloudWatch facilite la surveillance de vos ressources et applications AWS. En plus de s’intégrer de manière native à plus de 70 services AWS dont Amazon EC2, Amazon DynamoDB, Amazon S3, Amazon ECS, Amazon EKS, Amazon EKS et AWS Lambda, CloudWatch publie automatiquement des métriques détaillées d'une minute et des métriques personnalisées avec un niveau de précision pouvant atteindre 1 seconde pour vous permettre d'explorer profondément vos journaux et d'y ajouter du contexte. Vous pouvez également utiliser CloudWatch dans des architectures de cloud hybrides, notamment en utilisant l'agent CloudWatch ou l'API pour surveiller vos ressources sur site.
Améliorer la performance opérationnelle et l'optimisation des ressources
Amazon CloudWatch vous permet de définir des alarmes et d'automatiser des actions soit sur la base des seuils prédéfinis, soit sur celle des algorithmes de machine learning chargés d’identifier un comportement anormal dans vos métriques. À titre d’exemple, il peut lancer automatiquement Amazon EC2 Auto Scaling et peut arrêter une instance pour limiter les surcoûts. Vous pouvez aussi vous servir de CloudWatch Events sans serveur pour déclencher des flux de travail avec des services comme AWS Lambda, Amazon SNS, et AWS CloudFormation.
Obtenir des informations et gagner en visibilité opérationnelle
Vous avez besoin d’une appréciation opérationnelle unifiée, de données extrêmement précise en temps réel ainsi que de références historiques pour optimiser les performances et l’utilisation des ressources. CloudWatch fournit des tableaux de bord automatiques, des données d'un niveau de précision d’une seconde et jusqu'à 15 mois de stockage et de conservation des métriques. Vous pouvez aussi effectuer des calculs métriques sur vos données afin d’obtenir des informations opérationnelles et d'utilisation. Par exemple, vous pouvez agréger l'utilisation d'une flotte entière d'instances EC2.
Récupérer des informations exploitables dans des journaux
CloudWatch vous permet d'explorer, d'analyser et de visualiser vos journaux afin de résoudre facilement les problèmes opérationnels. Avec CloudWatch Logs Insights, vous ne payez que pour les requêtes que vous exécutez. CloudWatch Logs Insights s'adapte au volume de votre journal et à la complexité de votre requête pour vous donner des réponses en quelques secondes. Vous pouvez aussi publier des métriques basées sur les journaux, créer des alarmes et corréler des journaux et des métriques dans les tableaux de bord CloudWatch pour une visibilité opérationnelle complète.
Fonctionnement
CloudWatch collecte des données de surveillance et opérationnelles sous forme de journaux, de métriques et d'événements. Ensuite, il les visualise à l'aide de tableaux de bord automatisés pour vous permettre d’avoir une appréciation unifiée de vos ressources, applications et services AWS opérationnels sur AWS et sur site. Vous pouvez corréler vos métriques et vos journaux pour mieux comprendre la santé et la performance de vos ressources. Vous pouvez également créer des alarmes sur la base de seuils de valeurs métriques que vous spécifiez, ou qui peuvent surveiller un comportement anormal de vos métriques sur la base d’algorithmes de machine learning. Pour agir rapidement, vous pouvez configurer des actions automatisées, comme par exemple l’avertissement du déclenchement d'une alarme et la mise en route automatique de l’auto scaling de façon à réduire le temps moyen de résolution. Vous pouvez également faire une exploration et une analyse profondes de vos métriques, journaux et traces pour mieux comprendre comment améliorer les performances des applications.

Cas d'utilisation
Surveillance et dépannage d'infrastructure
Surveillez les métriques et les journaux clés, visualisez la pile de votre application et de votre infrastructure, créez des alarmes et mettez en corrélation les métriques et les journaux pour comprendre et traiter la cause première des problèmes de performances dans vos ressources AWS. Il s'agit notamment de la surveillance de votre écosystème de conteneurs à travers Amazon ECS, AWS Fargate, Amazon EKS et Kubernetes.
Amélioration du temps moyen de résolution
CloudWatch vous aide à corréler, visualiser et analyser les métriques et les journaux dans le but d’agir rapidement pour résoudre les problèmes et de les combiner avec les données de trace d'AWS X-Ray pour les observer de bout en bout. Vous pouvez également analyser les demandes des utilisateurs afin d’accélérer le dépannage et le débogage, et de réduire le temps moyen de résolution (MTTR) général.
Optimisation proactive des ressources
Les alarmes CloudWatch surveillent et comparent vos valeurs métriques aux seuils que vous spécifiez ou que CloudWatch crée pour vous. Elles le font en utilisant des modèles de machine learning pour détecter un comportement anormal. Si une alarme est déclenchée, CloudWatch peut agir automatiquement pour activer Amazon EC2 Auto Scaling ou arrêter une instance, par exemple, pour vous permettre d’automatiser la planification des capacités et des ressources.
Surveillance des applications
Surveillez vos applications qui s'exécutent sur AWS (sur Amazon EC2, sur les conteneurs et sans serveur) ou sur site. CloudWatch collecte des données à chaque couche de la pile de performance, y compris les métriques et les journaux sur les tableaux de bord automatiques.
Analyse des journaux
Explorez, analysez et visualisez vos journaux pour résoudre les problèmes opérationnels et améliorer la performance des applications. Vous pouvez lancer des requêtes pour répondre rapidement et efficacement aux problèmes opérationnels. Si un problème survient, vous pouvez en identifier rapidement les causes potentielles en lançant immédiatement l’interrogation à l'aide d'un langage d'interrogation spécialement conçu à cet effet.
« Nous utilisons une architecture basée sur les microservices. Nous avons trouvé en Amazon CloudWatch une solution instantanée, car elle ne nécessite aucune installation ou maintenance d'infrastructure. CloudWatch s'adapte parfaitement au fil de notre évolution et élimine la charge opérationnelle associée à l'intégration et à la gestion de plusieurs outils. Pour nous, le plus gros avantage de CloudWatch est la diminution du temps moyen de réparation (MTTR). En effet, il permet à notre équipe DevOps de trouver rapidement des problèmes dans notre infrastructure de conteneurs. »
- Vitaliy Geraymovych, Cofondateur et Vice-président de CloudPassage chargé de l'ingénierie
Clients
Les clients utilisent Amazon CloudWatch pour améliorer les performances opérationnelles, optimiser l'affectation des ressources et réduire le MTTR. Rendez-vous sur notre page clients pour en savoir plus sur la façon dont les organisations utilisent Amazon CloudWatch.

Mapbox utilise Amazon CloudWatch pour ingérer plusieurs sources de données et surveiller les charges de travail clés.

Pushpay utilise Amazon CloudWatch Logs Insights pour interroger les journaux et réduire la complexité opérationnelle.

Rackspace utilise l’agent Amazon CloudWatch pour surveiller ses machines virtuelles.

SendGrid utilise Amazon CloudWatch nativement sans avoir besoin d'une pile autogérée ou d'un fournisseur tiers.

CloudPassage utilise Amazon CloudWatch pour son architecture basée sur les microservices afin de réduire le temps moyen de réparation.

ConnectWise utilise Amazon CloudWatch pour surveiller les conteneurs, la latence, les requêtes de serveur Web et les requêtes d'équilibrage de charge entrantes.
Derniers billets du blog
Aucun blog Amazon CloudWatch n’est disponible pour le moment. Veuillez visiter la page blog AWS.
par Jeff Barr
27 novembre 2018
par Helen Lin
15 octobre 2018
Créer un tableau de bord Amazon CloudWatch en dehors d’AWS Management Console
par Stephen McCurry
2 octobre 2018
Créer des pipelines sans serveur avec Amazon CloudWatch Events
par Forrest Brazeal
02 mai 2019
Démarrer avec AWS

Commencer à créer dans la console
En savoir plus sur Amazon CloudWatch