Passer au contenu principal

Amazon CloudWatch

Opérations d’IA

Tirez parti de l’IA pour identifier, diagnostiquer et résoudre rapidement les problèmes opérationnels

Présentation

Profitez de la vaste expérience opérationnelle qu’AWS a accumulée et affinée au cours de ses 19 années passées à fournir des services cloud à des millions de clients dans le monde entier. Nous avons appliqué l’IA et le machine learning (ML) pour améliorer, accélérer et automatiser vos processus opérationnels dans le cloud. AIOps vous permet d’observer facilement vos charges de travail, d’accélérer le dépannage opérationnel et de prendre des mesures pour résoudre et corriger les problèmes opérationnels, améliorant ainsi le temps moyen de restauration (MTTR). 

Trouver la cause première des problèmes en une fraction de temps

Lancez une enquête opérationnelle où que vous soyez dans la console de gestion AWS. Vous pouvez configurer Amazon CloudWatch pour démarrer une enquête dès qu’une alarme se déclenche, ou créer une enquête à partir d’un chat Amazon Q. CloudWatch vous accompagne dans l’enquête pour vous aider à identifier les anomalies dans vos applications, et émet des hypothèses pour déterminer la cause première des problèmes.

Démarrez la démo interactive de CloudWatch Investigations

Missing alt text value

Résolution rapide des problèmes à l’aide de suggestions de mesures correctives

Amazon CloudWatch propose des mesures correctives pour les problèmes AWS courants en faisant apparaître les dossiers d’exploitation d’AWS Systems Manager Automation, les articles AWS re:Post et la documentation pertinents. Exécutez le dossier d’exploitation pour résoudre le problème afin de remettre rapidement vos applications critiques pleinement opérationnelles.

Consultez la documentation pour en savoir plus sur les enquêtes menées sur Amazon CloudWatch

Missing alt text value

Améliorez continuellement votre posture opérationnelle

Amazon CloudWatch utilise l’IA pour créer des rapports d’analyse post-incident complets en quelques minutes. Les rapports d’incidents vous aident à mieux identifier les tendances, à mettre en œuvre des mesures préventives et à améliorer continuellement votre posture opérationnelle grâce à une analyse post-incident structurée. Collectez et corrélez automatiquement les données de télémétrie opérationnelle critiques, les configurations de service et les résultats des enquêtes afin de générer des rapports détaillés qui favorisent les améliorations opérationnelles.  

En savoir plus sur l’analyse automatique des incidents et la création de rapports dans la documentation

Missing alt text value

Pour les opérateurs de tous niveaux d’expérience

Amazon CloudWatch se charge de la majeure partie du processus de dépannage. Vous n’avez donc pas besoin d’être un expert de toutes les ressources de votre application. Au cours d’une enquête opérationnelle, CloudWatch passe au crible des centaines de milliers de points de données pour découvrir les relations entre les services et comprendre comment ils fonctionnent ensemble. Après avoir analysé ses résultats, CloudWatch vous présente des hypothèses potentielles quant à la cause première du problème et vous explique comment le résoudre.

Afficher un exemple d’enquête

Missing alt text value

Détectez automatiquement les anomalies et les modèles

Amazon CloudWatch utilise le machine learning (ML) avancé pour définir automatiquement des références et détecter les anomalies dans vos données de télémétrie, vous évitant ainsi de passer au crible manuellement vos métriques et vos journaux. Recevez des alertes en cas de pics ou de tendances inhabituelles pour résoudre les problèmes avant qu’ils ne s’aggravent. CloudWatch met en évidence des modèles récurrents et des valeurs clés telles que les niveaux de gravité, ce qui vous permet de vous concentrer rapidement sur les journaux pertinents ou de comparer les comportements au fil du temps pour détecter les problèmes plus rapidement.

En savoir plus sur la détection des anomalies dans CloudWatch dans la documentation

Missing alt text value

Interroger les données de télémétrie à l’aide du langage naturel

Extrayez des informations à partir de votre télémétrie sans avoir à apprendre des langages de requêtes complexes. Au lieu d’écrire des requêtes complexes, vous pouvez simplement poser des questions dans un français simple, par exemple « Afficher les 10 requêtes AWS Lambda les plus lentes des dernières 24 heures », et Amazon CloudWatch générera automatiquement la syntaxe correcte. Grâce à la fonction de synthèse en langage naturel de CloudWatch Logs Insights, vous pouvez générer des résumés à partir des résultats de vos requêtes afin de vous aider à identifier rapidement les problèmes et à obtenir des informations exploitables à partir des données de vos journaux.

Découvrez comment utiliser les requêtes en langage naturel et la synthèse en langage naturel dans la documentation

Missing alt text value

Clients

Cedar Gate Technologies

Le fournisseur de technologies de santé Cedar Gate Technologies peut désormais identifier la cause première des problèmes opérationnels en 30 minutes environ, contre deux heures auparavant, en utilisant Amazon CloudWatch pour accélérer les enquêtes et résoudre rapidement les problèmes afin que les clients puissent continuer à prodiguer des soins précieux à leurs patients.

Missing alt text value

Amazon Kindle

Les ingénieurs d’assistance d’Amazon Kindle ont constaté une résolution des problèmes de 65 à 80 % plus rapide en utilisant Amazon CloudWatch pour les enquêtes, ce qui leur permet de répondre plus rapidement aux besoins des clients et de leur offrir la meilleure expérience d’utilisation possible. 

Missing alt text value

Amazon Music

Les développeurs d’Amazon Music utilisent Amazon CloudWatch comme assistant 24 heures sur 24 et 7 jours sur 7 pour automatiser les enquêtes et identifier les tendances des problèmes, ce qui leur permet d’avancer plus rapidement pendant leurs gardes. Les premières utilisations montrent qu’Amazon Music résout les problèmes deux fois plus vite, afin que les auditeurs puissent continuer à écouter leurs chansons préférées.

Missing alt text value

SmugMug

La plateforme de gestion de photos SmugMug utilisera Amazon CloudWatch pour analyser automatiquement les métriques, les journaux et les événements opérationnels sur l’ensemble de ses systèmes, ce qui lui permettra de diagnostiquer la plupart des problèmes en moins de 20 minutes et jusqu’à 50 % plus rapidement. Cela améliore l’efficacité opérationnelle en réduisant les recherches manuelles dans les journaux, ce qui permet à leur équipe de consacrer moins de temps et de ressources à la gestion des problèmes et plus de temps à créer la plateforme pour aider les photographes à développer leurs vitrines numériques.

Missing alt text value