David Yanacek
David Yanacek、シニアプリンシパルエンジニア
David Yanacek は、AWS の Amazon モニタリングと可観測性の組織で CloudWatch のようなサービスに取り組むシニアプリンシパルエンジニアです。2006 年から Amazon のソフトウェアデべロッパーとして、Amazon DynamoDB、AWS Lambda、AWS IoT に携わってきました。また、彼は社内のウェブサービスフレームワークやフリート運行自動化システムにも携わってきました。David の職場でのお気に入りの活動の 1 つは、ログ分析を実行し、運用メトリクスをふるいにかけて、システムを徐々にスムーズに実行する方法を見つけることです。
David 著
生産サービスモニタリングに対する Amazon のアプローチ
このセッションでは、チームがシステムの状態を大まかに評価する方法から、単一のリクエストの詳細を理解するためにズームインする方法まで、Amazon のモニタリングの全範囲について説明します。また、パーセンタイル、メトリクスの次元、ダッシュボード、ログ分析、ディストリビューティッド(分散)トレーシングについて Amazon がどのように考えているかについても学んでください。
アマゾンでのオペレーショナル・エクセレンス
このセッションでは、Amazon の運用慣行について学びます。ふりかえりの処理、知識の共有、運用指標の定期的な見直しなど、チームが慣れ親しんできた習慣が、いかにしてチームがより優れたツールを構築し、アーキテクチャを変えるための革新につながったか。
レジリエントなサーバーレスシステムの大規模な設計と運用
この動画では、モードやオーバーロードの回避、制限された作業の実行、複数レイヤーでのスロットリング、同時実行の防止、等価リクエストの送信、キューイングにおけるバックプレッシャーと公平性の適用、シャッフルシャーディングの実行など、信頼性が高く回復力のあるサービスを構築するために AWS が行っていることを説明します。
ヘルスチェックの実装
フリート全体でフォールスポジティブの意図しない結果は例外として、サーバー障害を自動的に検出して最小限に抑えます。
運用を可視化するための分散システムのインストルメンテーション
本番システムに対する可視性を実現して、ソフトウェア計測を使い障害をトラブルシューティングします。
負荷制限による過負荷の回避
過負荷が発生しても予測可能で安定したパフォーマンスを維持するための戦略。
依存関係分離による同時実行のオーバーロードの抑制
依存関係の障害による影響を抑えて、アプリケーション内の関連機能のみに影響するようにします。
マルチテナントシステムにおける公平性
マルチテナントシステムに公平性を組み込み、予測可能なパフォーマンスと可用性を提供します。
乗り越えられないキューバックログの回避
キューバックログから重要なワークロードを迅速にドレインすることを優先し、バックログを回避する。