Surveillance et observabilité

Obtenez des informations exploitables à partir des données de vos infrastructures et applications

« Mon système fonctionne-t-il ou non ? », « Est-il rapide ou lent selon mes utilisateurs finaux ? », « Quels indicateurs de performance et accords de niveau de service devons-nous définir, et comment savoir s'ils sont respectés ? » Quand vous travaillez à la vitesse et à l'échelle du cloud, vous ne pouvez pas vous permettre d'avancer à l'aveugle : vous devez être à même de répondre à un large éventail de question opérationnelles et commerciales de ce genre. Vous devez pouvoir détecter les problèmes dès qu'ils apparaissent (idéalement avant qu'ils ne perturbent l'activité du client), réagir rapidement, et les résoudre au plus vite. Pour ce faire, vous devez disposer d'une observabilité dans vos applications et ressources qui fonctionne avec les services AWS et non AWS.

Surveillance et observabilité

Qu'est-ce que l'observabilité ?

« Observabilité » décrit à quel point vous pouvez comprendre ce qu'il se passe dans un système, souvent (mais pas seulement) en l'instrumentant pour collecter des métriques, des journaux ou des traces. Il existe différents types d'outils et d'activités qui rendent un système observable, y compris la surveillance, le traçage, le profilage, les journaux, et l'IA/Ops. L'observabilité vous permet de détecter, d'étudier et de résoudre les problèmes.

Dans le cloud, l'observabilité peut être difficile à obtenir, tout simplement en raison de la complexité du système. Des applications monolithiques antérieures sont réparties entre plusieurs instances et, souvent, régions géographiques. Leur architecture peut également avoir été modifiée en nombreux micro-services dépendant de milliers de ressources pour fonctionner, en particulier s'ils s'exécutent sur des conteneurs ou une technologie sans serveur. Les micro-services peuvent être mis à jour souvent, évoluer de manière élastique ou être invoqués à la demande. Des milliers de composants génèrent des milliards de métriques, journaux et traces dans un flux sans fin de données.
 

Avantages

Comprendre la santé et les performances d'une application pour améliorer l'expérience client

L'observabilité a pour principal objectif de savoir ce qu'il se passe (n'importe où et partout) dans votre système afin que vous puissiez garantir la meilleure expérience possible à vos utilisateurs finaux. Vous avez besoin de détecter les problèmes rapidement, de les étudier efficacement et de les résoudre au plus vite pour minimiser les temps d'arrêt et autres perturbations pour vos clients.

Améliorer la productivité des développeurs

Le débogage classique (en analysant les journaux ou en instrumentant les points de rupture dans le code) est fastidieux, répétitif et chronophage, et n'évolue pas correctement pour les applications de production ou celles créées à l'aide d'une architecture de micro-services ou sans serveur. Pour analyser les performances des applications distribuées, les développeurs ont besoin de métriques et de traces corrélées pour identifier l'impact sur l'utilisateur à partir de n'importe quelle source, et de trouver les chemins de code brisé ou coûteux le plus vite possible. Et ils doivent faire tout cela sans devoir ré-instrumenter leur code quand ils veulent ajouter de nouveaux outils d'observabilité à leur kit.

Obtenir plus d'informations avec les visualisations

L'observabilité, en particulier à l'échelle du cloud, peut générer d'énormes volumes de données, qui deviennent difficiles à analyser pour un humain. Les outils de visualisation aident les humains à comprendre les données en corrélant les données d'observabilité dans des présentations graphiques intuitives. Toutefois, se retrouver face à un paquet de graphiques, schémas, etc. répartis dans plusieurs outils et présentations devient un problème en soi. Il est crucial de pouvoir centraliser des données visuelles en un seul tableau de bord, afin que vous disposiez d'une vision unifiée des informations critiques sur votre système et ses performances.

Témoignages de clients

Mapbox

Mapbox

Mapbox est une plateforme de cartographie open source qui fournit des cartes personnalisées à plus de 300 millions de personnes chaque mois. Mapbox utilise Amazon CloudWatch pour ingérer plusieurs sources de données (y compris des métriques AWS natives, des métriques personnalisées et des journaux), ainsi que pour surveiller et visualiser des charges de travail clés et optimiser les ressources.

« Nous cherchions à consolider toutes nos activités de surveillance, de journalisation, de métriques et d'alerte en un seul outil. CloudWatch nous a aidés à alléger le fardeau opérationnel que représentaient la définition, la configuration et l'apprentissage de systèmes tiers. Nos équipes utilisent énormément CloudWatch pour surveiller les taux d'erreur et les codes d'état de plusieurs importantes charges de travail. Nous utilisons également CloudWatch pour automatiser des actions Auto Scaling, ce qui nous permet d'optimiser le coût des types d'instance Amazon EC2 qui alimentent nos clusters Amazon ECS. CloudWatch Events nous permet de fournir à nos équipes des informations d'utilisation et de tarification afin qu'elles puissent auditer la sécurité des comptes, déclencher des actions AWS Lambda pour les cas d'utilisation de conformité et de sécurité, et programmer nos ressources à l'aide du cloud. CloudWatch permet une automatisation de nouvelle génération et augmente la capacité de chacun. »

Emily McAfee, Platform Engineering Manager - Mapbox

Pushpay

Pushpay

Pushpay a pour objectif de réunir les personnes en renforçant la communauté, les relations et le sentiment d'appartenance. Nous créons des solutions de publication d'applications de dons mobiles de niveau international afin d'aider les organisations à développer leurs communautés.

« Notre solution actuelle d'analyse des journaux entraîne des frais de configuration et de maintenance, a des exigences de rétention différentes et est très coûteuse, ce qui empêche notre équipe d'ingénieurs d'accéder aux journaux et de les interroger dans des environnements tant de développement que de test. Grâce à CloudWatch Logs Insights, nous sommes désormais capables d'interroger des journaux au sein même de CloudWatch Logs, réduisant ainsi la complexité opérationnelle. Le paiement par requête nous donne la souplesse nécessaire pour évoluer à notre rythme, et nos ingénieurs peuvent commencer à consommer et interroger des journaux sans attendre la configuration, l'intégration et l'ingestion avec notre solution actuelle. Nous pouvons également consulter les métriques et les journaux, ce qui permet un dépannage plus rapide. Logs Insights est une solution efficace et bon marché qui permet à nos ingénieurs de surveiller leurs applications et d'analyser les journaux en profondeur, tout cela depuis une seule console AWS. »

Peter Goodman, Director Site Reliability Engineering - Pushpay

SendGrid

SendGrid

SendGrid est un fournisseur de messagerie électronique sur le cloud. L'entreprise envoie plus de 40 milliards d'e-mails chaque mois, pour plus de 69 000 clients payants. SendGrid a adopté Amazon CloudWatch au début de sa migration vers AWS afin d'obtenir une visibilité du système, des informations opérationnelles et une optimisation des ressources.

« CloudWatch nous permet de collecter des métriques issues de services AWS tels que Amazon EC2, Amazon Kinesis, Amazon DynamoDB et Amazon API Gateway, ainsi que des journaux provenant des fonctions AWS Lambda. Nous avons apprécié la capacité d'intégration native, sans qu'une pile autogérée ou qu'un fournisseur SaaS tiers soit nécessaire. Cela nous a aidés à démarrer très rapidement avec les alertes, la scalabilité automatique et la planification des capacités. Pouvoir traiter nos principaux cas d'utilisation rapidement et facilement a fait de CloudWatch notre solution de préférence. »

Joshua Barratt, Architect II - SendGrid

Se familiariser avec l'observabilité

Participez à l'atelier interactif et immersif One Observability et familiarisez-vous avec Amazon CloudWatch et AWS X-Ray. Au cours de cet atelier, vous allez déployer une application de microservices complexe et mettre en place le suivi et l'observabilité dans un environnement moderne. À la fin de l'atelier, vous aurez une compréhension claire de la journalisation, des métriques, de la surveillance des conteneurs et des systèmes sans serveur ainsi que des techniques de traçage.

Commencer l'atelier 
Nouveautés
Date (de la plus récente à la plus ancienne)
  • Date (de la plus récente à la plus ancienne)
1
Aucun résultat trouvé.
Blog
Date
  • Date
1
Aucun blog trouvé correspondant à ces critères.

Découvrir d'autres cas d'utilisation relatifs à la gestion et la gouvernance dans AWS

Page-Illo_AWS-Management-Governance_Open and Custom Resource Provisioning
Mise en service et orchestration »

Créer, mettre en service et partager des ressources

Page-Illo_AWS-Management-Governance_Automated Configuration Compliance and Auditing
Configuration, conformité et audit »

Auditer et corriger vos configurations de ressource

Page-Illo_AWS-Management-Governance_Centralized and Automated Operations Management
Gestion centralisée des opérations »

Gérer vos opérations dans le cloud

Page-Illo_AWS-Management-Governance_Governance at Scale
Gouvernance et contrôle de l'entreprise »

Mettre en place un environnement AWS sécurisé, multicompte et géré de façon centralisée