Passer au contenu principal

L’Amazon Builders’ Library

David Yanacek, ingénieur en chef senior

David Yanacek est un ingénieur en chef senior qui travaille sur des services tels que CloudWatch au sein de l'organisation Amazon Surveillance & Observabilité d'AWS. David est développeur de logiciels chez Amazon depuis 2006. Il travaillait auparavant sur Amazon DynamoDB, AWS Lambda et AWS IoT. Il a également travaillé sur des cadres de services web internes et des systèmes d'automatisation des opérations de la flotte. L'une des activités professionnelles préférées de David est d'effectuer des analyses de journaux et de parcourir des métriques opérationnelles dans le but de trouver des solutions pour que les systèmes s'exécutent de mieux en mieux au fil du temps.

Twitter LinkedIn github

A portrait photo of a smiling person wearing glasses and a collared shirt, outdoors with a blurred background.

De David

L'approche d'Amazon en matière de surveillance des services de production
Cette séance couvre tout le spectre de la surveillance chez Amazon, de la manière dont les équipes évaluent l'état du système à un niveau élevé à la manière dont elles zooment pour comprendre les détails d'une seule demande. Découvrir également comment Amazon envisage les percentiles, la dimensionnalité des métriques, les tableaux de bord, l'analyse des journaux et le traçage distribué.

L'excellence opérationnelle chez Amazon
Au cours de cette session, découvrez les pratiques opérationnelles d'Amazon. Comment les habitudes adoptées par les équipes, telles que la gestion des rétrospectives, le partage des connaissances et la révision régulière des indicateurs opérationnels, ont incité les équipes à innover pour créer de meilleurs outils et opérer des changements architecturaux.

Conception et exploitation de systèmes sans serveur résilients à grande échelle
Dans cette vidéo, nous expliquons ce que fait AWS pour créer des services fiables et résilients, notamment en évitant les modes et les surcharges, en effectuant un travail limité, en limitant plusieurs couches, en protégeant la simultanéité, en envoyant des requêtes idempotentes, en appliquant une contre-pression et en garantissant l'équité des files d'attente, et le partitionnement aléatoire.

Mise en œuvre de bilans de
Détection et atténuation automatiques des pannes de serveur sans conséquences involontaires dues aux faux positifs de l'ensemble de la flotte.

Instrumentation de systèmes distribués pour une visibilité opérationnelle
Visibilité opérationnelle dans les systèmes de production et résolution des dysfonctionnements avec des instruments logiciels.

Utiliser le délestage pour éviter les surcharges
Stratégies pour maintenir des performances prévisibles et constantes face à une surcharge.

Utilisation de l'isolation des dépendances pour contenir la surcharge de concurrence
Contenir l'impact causé par une dépendance défaillante afin d'affecter uniquement les fonctionnalités pertinentes d'une application. 

Équité dans les systèmes à locataires multiples
Intégrer l'équité dans les systèmes multilocataires afin de fournir des performances et une disponibilité prévisibles.

Éviter les arriérés insurmontables dans les files d'attente
Donner la priorité à l'évacuation rapide des charges de travail importantes des files d'attente, et éviter les retards en premier lieu.