プロアクティブな監視、問題解決、データ主導のインサイトを通じて AWS リソースのパフォーマンスと可用性を最適化し、円滑で効率的かつ安全なクラウド運用を実現します。
データを表示して問題の根本原因を迅速に診断することで、平均解決時間 (MTTR) を短縮します。
コンテナとサーバーレスサービス全体でエンドツーエンドのオブザーバビリティと分析を統合し、サービス間の面倒なタグ付けやイベントの相関関係を排除します。
コンテナとサーバーレスワークロードのモニタリングとトラブルシューティングを行い、レジリエンスと効率性を高めます。例えば、CloudWatch の AI と ML を利用した機能を活用して、自然言語を使用してログやメトリクスをクエリしたり、パターンを分析して異常を検出したり、CloudWatch ログ内の機密データを自動的にマスクしたりできます。
Amazon Bedrock と Amazon CloudWatch の力を活用して、生成 AI アプリケーションのパフォーマンスを効果的にモニタリングし、最適化します。CloudWatch Container Insights を使用して、Amazon EKS クラスター内の NVIDIA GPU の主要なヘルスメトリクスを自動的に検出してモニタリングできるため、リソースの使用状況、可用性、レイテンシーを可視化できます。CPU、メモリ、GPU、ネットワークのメトリクスを分析して効率性を高められるように最適化し、潜在的なボトルネックや異常を早期に特定します。
CloudWatch ダッシュボードとアラームを使用して実行時間、エラー、スロットルなどの主要な運用メトリクスを監視することで、サーバーレスアプリケーションのパフォーマンスに関する深いインサイトを得ることができます。さらに、CloudWatch Logs Insights を使用してログデータと分散トレースを分析し、潜在的なボトルネックを特定できます。これらの CloudWatch 機能を活用することで、サーバーレスアーキテクチャを最適化してコストと効率を高めることができます。
CloudWatch Container Insights は、クラスター、ノード、サービス、コンテナレベルのデータを含む、AWS Fargate、Amazon ECS、および Amazon EKS の包括的なヘルスメトリクスとパフォーマンスメトリクスを示します。また、EKS コントロールプレーンと KubeState メトリクスを統合して、問題の根本原因を分析および特定することもできます。