David Yanacek, ingegnere capo
David Yanacek è un ingegnere capo che lavora su servizi quali CloudWatch nell'organizzazione Monitoraggio e osservabilità di Amazon in AWS. David è stato sviluppatore software in Amazon sin dal 2006 e in passato ha lavorato su Amazon DynamoDB, AWS Lambda e AWS IoT. Ha lavorato anche su framework di servizi Web interni e sistemi di automazione delle operazioni dei parchi istanze. Una delle attività preferite di David al lavoro è l'analisi dei log e il vaglio dei parametri operativi per scoprire come rendere sempre più fluida l'esecuzione dei sistemi nel tempo.
Realizzato da David
L'approccio di Amazon al monitoraggio dei servizi di produzione
Questa sessione copre l'intero spettro del monitoraggio in Amazon, dal modo in cui i team valutano lo stato del sistema ad alto livello a come ingrandiscono per comprendere i dettagli di una singola richiesta. Inoltre, scoprirai come Amazon pensa ai percentili, alla dimensionalità dei parametri, ai pannelli di controllo, all'analisi dei log e al tracciamento distribuito.
Eccellenza operativa in Amazon
In questa sessione, scopri le pratiche operative di Amazon. In che modo le abitudini adottate dai team, come la gestione delle retrospettive, la condivisione delle conoscenze e la revisione regolare delle metriche operative, hanno portato i team a innovare per creare strumenti migliori e apportare cambiamenti architettonici.
Progettazione e gestione di sistemi serverless resilienti su larga scala
In questo video, viene spiegato cosa fa AWS per creare servizi affidabili e resilienti, tra cui evitare modalità e sovraccarichi, eseguire lavori limitati, limitare la limitazione a più livelli, proteggere la concorrenza, inviare richieste idempotenti, applicare contropressione ed equità nelle code ed eseguire lo shuffle sharding.
Implementazione dei controlli sanitari
Rilevamento e mitigazione dei guasti del server senza conseguenze impreviste dovute ai falsi positivi a livello di flotta.
Strumentazione dei sistemi distribuiti per la visibilità operativa
Acquisizione di visibilità operativa dei sistemi di produzione e risoluzione dei problemi in caso di guasti con la strumentazione software.
Utilizzo della riduzione del carico per evitare il sovraccarico
Strategie per mantenere prestazioni prevedibili e uniformi a fronte dei sovraccarichi.
Utilizzo dell'isolamento delle dipendenze per contenere il sovraccarico di concorrenza
Contenere che l'impatto causato da una dipendenza non riuscita influisca solo sulla funzionalità pertinente di un'applicazione.
Equità nei sistemi multi-tenant
Integrare l'equità nei sistemi multitenant per fornire prestazioni e disponibilità prevedibili.
Evitare insormontabili arretrati nelle code
Dare la precedenza alla rapida evasione di importanti carichi di lavoro dai backlog ed evitare del tutto i backlog.