- Amazon CloudWatch›
- Caractéristiques›
- AIOps
Opérations d’IA
Tirez parti de l’IA pour identifier, diagnostiquer et résoudre rapidement les problèmes opérationnels
Présentation
Profitez de la vaste expérience opérationnelle qu’AWS a accumulée et affinée au cours de ses 19 années passées à fournir des services cloud à des millions de clients dans le monde entier. Nous avons appliqué l’IA et le machine learning (ML) pour améliorer, accélérer et automatiser vos processus opérationnels dans le cloud. AIOps vous permet d’observer facilement vos charges de travail, d’accélérer le dépannage opérationnel et de prendre des mesures pour résoudre et corriger les problèmes opérationnels, améliorant ainsi le temps moyen de restauration (MTTR).
Trouver la cause première des problèmes en une fraction de temps
Lancez une enquête opérationnelle où que vous soyez dans la console de gestion AWS. Vous pouvez configurer Amazon CloudWatch pour démarrer une enquête dès qu’une alarme se déclenche, ou créer une enquête à partir d’un chat Amazon Q. CloudWatch vous accompagne dans l’enquête pour vous aider à identifier les anomalies dans vos applications, et émet des hypothèses pour déterminer la cause première des problèmes.
Résolution rapide des problèmes à l’aide de suggestions de mesures correctives
Amazon CloudWatch propose des mesures correctives pour les problèmes AWS courants en faisant apparaître les dossiers d’exploitation d’AWS Systems Manager Automation, les articles AWS re:Post et la documentation pertinents. Exécutez le dossier d’exploitation pour résoudre le problème afin de remettre rapidement vos applications critiques pleinement opérationnelles.
Consultez la documentation pour en savoir plus sur les enquêtes menées sur Amazon CloudWatch
Améliorez continuellement votre posture opérationnelle
Amazon CloudWatch utilise l’IA pour créer des rapports d’analyse post-incident complets en quelques minutes. Les rapports d’incidents vous aident à mieux identifier les tendances, à mettre en œuvre des mesures préventives et à améliorer continuellement votre posture opérationnelle grâce à une analyse post-incident structurée. Collectez et corrélez automatiquement les données de télémétrie opérationnelle critiques, les configurations de service et les résultats des enquêtes afin de générer des rapports détaillés qui favorisent les améliorations opérationnelles.
Pour les opérateurs de tous niveaux d’expérience
Amazon CloudWatch se charge de la majeure partie du processus de dépannage. Vous n’avez donc pas besoin d’être un expert de toutes les ressources de votre application. Au cours d’une enquête opérationnelle, CloudWatch passe au crible des centaines de milliers de points de données pour découvrir les relations entre les services et comprendre comment ils fonctionnent ensemble. Après avoir analysé ses résultats, CloudWatch vous présente des hypothèses potentielles quant à la cause première du problème et vous explique comment le résoudre.
Détectez automatiquement les anomalies et les modèles
Amazon CloudWatch utilise le machine learning (ML) avancé pour définir automatiquement des références et détecter les anomalies dans vos données de télémétrie, vous évitant ainsi de passer au crible manuellement vos métriques et vos journaux. Recevez des alertes en cas de pics ou de tendances inhabituelles pour résoudre les problèmes avant qu’ils ne s’aggravent. CloudWatch met en évidence des modèles récurrents et des valeurs clés telles que les niveaux de gravité, ce qui vous permet de vous concentrer rapidement sur les journaux pertinents ou de comparer les comportements au fil du temps pour détecter les problèmes plus rapidement.
En savoir plus sur la détection des anomalies dans CloudWatch dans la documentation
Interroger les données de télémétrie à l’aide du langage naturel
Extrayez des informations à partir de votre télémétrie sans avoir à apprendre des langages de requêtes complexes. Au lieu d’écrire des requêtes complexes, vous pouvez simplement poser des questions dans un français simple, par exemple « Afficher les 10 requêtes AWS Lambda les plus lentes des dernières 24 heures », et Amazon CloudWatch générera automatiquement la syntaxe correcte. Grâce à la fonction de synthèse en langage naturel de CloudWatch Logs Insights, vous pouvez générer des résumés à partir des résultats de vos requêtes afin de vous aider à identifier rapidement les problèmes et à obtenir des informations exploitables à partir des données de vos journaux.
Découvrez comment utiliser les requêtes en langage naturel et la synthèse en langage naturel dans la documentation
Services et solutions en vedette
Clients
Cedar Gate Technologies
Le fournisseur de technologies de santé Cedar Gate Technologies peut désormais identifier la cause première des problèmes opérationnels en 30 minutes environ, contre deux heures auparavant, en utilisant Amazon CloudWatch pour accélérer les enquêtes et résoudre rapidement les problèmes afin que les clients puissent continuer à prodiguer des soins précieux à leurs patients.
Amazon Kindle
Les ingénieurs d’assistance d’Amazon Kindle ont constaté une résolution des problèmes de 65 à 80 % plus rapide en utilisant Amazon CloudWatch pour les enquêtes, ce qui leur permet de répondre plus rapidement aux besoins des clients et de leur offrir la meilleure expérience d’utilisation possible.
Amazon Music
Les développeurs d’Amazon Music utilisent Amazon CloudWatch comme assistant 24 heures sur 24 et 7 jours sur 7 pour automatiser les enquêtes et identifier les tendances des problèmes, ce qui leur permet d’avancer plus rapidement pendant leurs gardes. Les premières utilisations montrent qu’Amazon Music résout les problèmes deux fois plus vite, afin que les auditeurs puissent continuer à écouter leurs chansons préférées.
SmugMug
La plateforme de gestion de photos SmugMug utilisera Amazon CloudWatch pour analyser automatiquement les métriques, les journaux et les événements opérationnels sur l’ensemble de ses systèmes, ce qui lui permettra de diagnostiquer la plupart des problèmes en moins de 20 minutes et jusqu’à 50 % plus rapidement. Cela améliore l’efficacité opérationnelle en réduisant les recherches manuelles dans les journaux, ce qui permet à leur équipe de consacrer moins de temps et de ressources à la gestion des problèmes et plus de temps à créer la plateforme pour aider les photographes à développer leurs vitrines numériques.