Amazon DevOps Guru

Service d'opérations du cloud optimisé par le ML pour améliorer la disponibilité de l'application

Amazon DevOps Guru est un service optimisé par le Machine Learning (ML) qui facilite l'amélioration de la performance opérationnelle et de la disponibilité d'une application. DevOps guru détecte les comportements qui s’écarte des modèles opérationnels habituels pour vous permettre d’identifier les problèmes opérationnels avant qu’ils n’impactent vos clients.

DevOps Guru utilise des modèles de machine learning qui se basent sur des années d’Amazon.com et une excellence opérationnelle des services AWS dans l’identification des comportements anormaux des applications (Ex. temps de latence, taux d’erreur, manque de ressources, etc.) et souligne les problèmes critiques qui peuvent causer de possible interruptions ou perturbations de service. Quand DevOps Guru identifie un problème critique, il envoie automatiquement une alerte et fournit un résumé des anomalies relevées, la probable cause racine, et informe sur quand et où le problème est apparu. Quand cela est possible DevOps Guru, fournit également des recommandations sur la manière de résoudre le problème.

DevOps Guru ingère automatiquement les données opérationnelles de vos applications AWS et fournit un tableau de bord unique pour visualiser les problèmes dans vos données opérationnelles. Vous pouvez commencer avec DevOps Guru en sélectionnant la couverture depuis vos piles CloudFormation ou votre compte AWS pour améliorer la disponibilité et la fiabilité de l'application sans configuration manuelle ni expertise en Machine Learning.

7 200 ressources heures AWS gratuites

pour chaque ressource du groupe A et du groupe B

chaque mois pendant 3 mois grâce à l'offre gratuite AWS

Avantages

2_icon_2_resolve_issues

Détection automatique des problèmes opérationnels

Grâce au machine learning, Amazon DevOps Guru collecte et analyse automatiquement les données comme les métriques d'application, les journaux, les événements et les comportements qui ne suivent pas les modèles de fonctionnement normaux. Il détecte et alerte automatiquement des problèmes et risques opérationnels, comme l'épuisement imminent des ressources, les changements de code et de configuration qui pourraient provoquer des pannes, les fuites de mémoire, une capacité de calcul sous-allouée et une surexploitation d'E/S de base de données.

2_icon_1_auto_detect

Résolution rapide des problèmes avec les informations optimisées par le ML

Amazon DevOps Guru permet de réduire le temps d'identification et de résolution de l'origine des problèmes en mettant en corrélation les comportements anormaux et les événements opérationnels. Quand un problème survient, DevOps Guru génère des informations avec un résumé des anomalies présentes, des informations contextuelles concernant le problème et, si possible, suggère des recommandations concrètes pour le résoudre.

2_icon_3_easily_scale

Évolution rapide et disponibilité maintenue

Amazon DevOps Guru vous sauvegarde le temps et les efforts employés dans une mise à jour et vous prévient quand vous pouvez effectivement contrôler des applications complexes qui évoluent. Quand vous changez ou adoptez de nouveaux services AWS, DevOps Guru analyse automatiquement leurs paramètres, enregistrements et évènements. Ensuite il produit des connaissance, pour vous aidez à vous adaptez facilement au changement de comportement et à l ’évolution de l’architecture du système.

2_icon_4_reduce_noise

Réduit le bruit et la fatigue des alarmes


Amazon DevOps Guru aide les développeurs et les opérateurs informatiques à réduire le bruit et à surmonter la fatigue des alarmes par l’utilisation de modèles de machine learning pré-entraînés afin de corréler et regrouper les anomalies relevées et souligne les alertes les plus critiques. Avec DevOps guru, vous pouvez réduire la nécessité de gérer plusieurs outils de surveillance et alarmes, ce qui signifie que vous pouvez vous concentrer sur la cause racine du problème et y remédier.

Fonctionnement

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


Obtenez des informations opérationnelles avec Amazon Dev Ops

Cas d'utilisation

Améliorer la performance opérationnelle et la disponibilité

Amazon DevOps Guru vous permet d'éviter les incidents opérationnels avant qu'ils ne surviennent. DevOps Guru fait ressortir les résultats peu ou moyennement sévères qui ne sont pas particulièrement critiques. Cependant s'ils sont ignorés, ils peuvent avoir des répercussions sur la disponibilité de votre application dans le temps. Par exemple, DevOps Guru vous avertit lorsque les limites de vos groupes Auto Scaling sont atteintes, que des changements ont lieu dans les modèles de latence ou que le volume des appels d'API a augmenté afin que vous puissiez traiter ces problèmes avant leur aggravation.

Découvrir de façon dynamique de nouvelles ressources et métriques

À mesure que votre application évolue et que de nouvelles ressources sont prises en charge, DevOps Guru apprend des modèles pour chaque nouvelle métrique et vous avertit rapidement des problèmes opérationnels. Vous n'avez plus besoin de mettre à jour ou de corriger des alarmes mal configurées car DevOps Guru ingère les métriques de ces ressources et les classe automatiquement. 

Réduire le temps moyen de récupération (MTTR)

Vous pouvez diagnostiquer et corriger rapidement les problèmes en tirant parti des informations opérationnelles de DevOps Guru. Ces informations vous permettent de réduire le temps d'interruption grâce à des données pertinentes sur les ressources affectées et les anomalies associées. Elles suggèrent des moyens de les corriger en utilisant des données contextuelles, telles que des journaux et des événements adaptés.

Gestion proactive des ressources

DevOps Guru vous permet de savoir quand vos ressources épuisables, comme la mémoire, l'UC, l'espace disque, dépasseront leurs capacités allouées. DevOps Guru ingère et analyse en continu vos ressources et applications qui tournent sur AWS et vous aide à éviter une défaillance imminente en créant une notification discrète dans le tableau de bord.

Clients

SmugMug
« Nous sommes toujours à la recherche de moyens de réduire le temps consacré par nos équipes à la résolution des problèmes opérationnels. Nous utilisons désormais Amazon DevOps Guru et tirons parti des informations fournies par le ML pour nous aider à identifier, mettre en relation et résoudre rapidement les problèmes opérationnels. Grâce aux informations fournies par Amazon DevOps Guru, nos équipes peuvent maintenant détecter des problèmes sans devoir partir de zéro pour essayer d'en trouver la cause profonde. Notre équipe informatique a réduit considérablement notre temps moyen de récupération (MTTR) et a permis de gagner des heures de résolution de problèmes tout en garantissant à nos clients la meilleure expérience possible. »

- Anchal Gupta
Senior Technical Lead, DevOps

Thomson Reuters
« L'expérience et la satisfaction de nos clients sont nos principales priorités. Lorsque de nombreuses sources d'alertes et d'événements de surveillance sont reçues, il peut être difficile et fastidieux de filtrer les informations pour identifier les incidents ayant un impact sur le client. Avec Amazon DevOps Guru, nous sommes en mesure de tirer parti des informations fournies par le ML afin de prendre les mesures nécessaires pour réduire, et dans beaucoup de cas éliminer, les répercussions sur nos clients. L'intégration d'Amazon DevOps Guru à PagerDuty permet également de fournir rapidement et efficacement des recommandations aux bonnes personnes, au bon moment. Grâce à cela, nous prévoyons une baisse importante des temps d'arrêt opérationnels. »

- Steve Thoennes
Directeur de l’infrastructure Hosting Porfolio

605
« Nous avons des dizaines de comptes AWS et des dizaines de milliers de ressources à surveiller. Même si nous utilisons des solutions d'infrastructure en tant que code et que nous créons des alertes dynamiques pour ces services, il est difficile de gérer et de mettre en relation des métriques pour résoudre rapidement les problèmes. Grâce à Amazon DevOps Guru, nous avons la certitude que les alertes et les notifications que nous recevons sont exactes car elles proviennent de métriques alimentées par le Machine Learning et corrélées entre de nombreux services. La mise en place de l’intégration d'Amazon DevOps Guru n'a pris que quelques minutes, et l'intégration à nos milliers de piles AWS CloudFormation s'est faite en un rien de temps. Amazon DevOps Guru a fourni des informations qui nous ont aidés à nous concentrer sur la feuille de route de notre infrastructure. »

- Jared Williams
Directeur, DevOps

Partenaires

Atlassian
« Atlassian est heureux que nos clients mettent en œuvre une stratégie AIOps à l'aide d'Amazon DevOps Guru pour gérer les performances opérationnelles de leurs applications cloud. Avec l'intégration de notre nouveau Opsgenie et de Jira Service Management, les bonnes équipes sont averties dès l'instant où Amazon DevOps Guru découvre un problème potentiel ; celui-ci est classé par ordre de priorité selon le niveau de gravité de l'incident grâce au Machine Learning (ML). Cette intégration garantit que chaque équipe peut réagir rapidement à chaque incident, le résoudre avec les recommandations générées par le ML et en tirer des enseignements. »

- Emel Dogrusoz
Chef de produit, Opsgenie

Découvrez comment fournir des informations opérationnelles directement à votre équipe de garde en intégrant Amazon DevOps Guru à Atlassian Opsgenie.
PagerDuty
« PagerDuty renforce sont partenariat avec AWS par le biais d'une nouvelle intégration avec Amazon DevOps Guru. La plateforme de gestion des opérations numériques de PagerDuty a été créée pour accélérer la transition vers la culture DevOps et nous sommes heureux de poursuivre cet engagement avec cette intégration. En exploitant les capacités de Machine Learning de DevOps Guru, PagerDuty offre des capacités d'action-réaction en temps réel à nos clients communs. Grâce à l'intégration par PagerDuty d'Amazon SNS d'Amazon DevOps Guru, les clients AWS peuvent agir en temps réel sur les problèmes opérationnels avant que ces derniers ne deviennent des pannes qui impactent les clients.» 

- Jonathan Rende
SVP de produit

Découvrez comment fournir des informations opérationnelles optimisées par le ML à vos équipes de garde via PagerDuty et Amazon DevOps Guru.

Articles de blog et autres articles >>

devops guru 1a

New- Amazon DevOps Guru Helps Identify Application Errors and Fixes

Décembre 2020

Harunobu Kameda

Lire le blog

devops guru 2

Configurer facilement Amazon DevOps Guru à travers plusieurs comptes et régions à l'aide d'AWS CloudFormation StackSets

Décembre 2020

Nikunj Vaidya et Nuatu Tseggai

Lire le blog

devops guru reinvent thumbnail

AWS re:Invent 2020: améliorer la disponibilité des applications avec des informations alimentées par le ML à l'aide d'Amazon DevOps Guru

Décembre 2020

Jacob Sullivan

Regarder le webinaire

devops guru 4

Amazon DevOps Guru est alimenté par des modèles de ML préentraînés qui encodent l'excellence opérationnelle

Février 2020

Caner Turkmen, Ravi Turlapati et Tim Januschowski

Lire le blog

7_bottom_promo_icon

Automatiser les révisions de code
Détecter les problèmes de code plus tôt et plus rapidement avec Amazon CodeGuru

Standard Product Icons (Features) Squid Ink
Découvrir les fonctionnalités du produit

Améliorer facilement la performance opérationnelle et la disponibilité de votre application

En savoir plus 
Sign up for a free account
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Standard Product Icons (Start Building) Squid Ink
Commencez à créer sur la console

Commencez à créer avec Amazon DevOps Guru dans AWS Management Console.

Se connecter