投稿日: Nov 2, 2021

Amazon DevOps Guru は、Amazon Elastic Kubernetes Service (EKS) によって管理されるクラスター用のノードおよびポッドレベルで追加のメトリクスをサポートするようになりました。

Amazon DevOps Guru は、アプリケーションの運用パフォーマンスと可用性の改善を容易にする、機械学習 (ML) を利用したサービスです。Amazon DevOps Guru がこれらのメトリクスで異常な動作を検出すると、異常な動作の診断と対処に役立つインサイトを作成します。これには、問題に関連するメトリクスとイベントのレコメンデーションとリストが含まれます。

クラスターレベルの集計に依存する代わりに、これらのノードレベルのメトリクスを使用すると、メモリ、CPU、またはファイルシステムの使用率が高い可能性のある特定のノードを発見するのに役立ちます。pod_cpu_utilization_over_pod_limit と pod_memory_utilization_over_pod_limit を含むポッドレベルのメトリクスは、ソフト制限を超えそうになっており、したがってハードリソースの制約が適用される危険が生じていて、リソースの枯渇によりエラーが発生するリスクがあるポッドを特定するのに役立ちます。Amazon DevOps Guru は、コンテナの再起動を追跡し、イメージのプルに関する問題やアプリケーションの起動に関する問題を通知するようにもなりました。また、コンテナ向けの Amazon DevOps Guru サポートを引き続き拡張していく予定です。

さらに、Amazon DevOps Guru コンソールで、クラスターレベルでメトリクスごとにグループ化された Amazon EKS インサイトを表示する新しいコンソールビューも導入しています。このビューにより、潜在的な問題が EKS クラスター内のどこにあるかをより詳細に把握できます。例えば、ノードでネットワーク接続の問題が発生している場合、またはディスクプレッシャーが発生している場合、ノードと名前空間の異常がクラスターごとにそのメトリクスの下にグループ化されて表示されます。これは、問題のある特定のノードまたは名前空間を特定するのに役立ちます。

これらの新機能を使用するには、Amazon EKS で Container Insights を有効にする必要があります。

CloudFormation スタックまたは AWS アカウントからカバレッジを選択することで、Amazon DevOps Guru の使用を開始できます。詳細については、DevOps Guru の製品ページドキュメントページにアクセスするか、Amazon DevOps Guru フォーラムに質問を投稿してください。