- Amazon CloudWatch›
- 特徴›
- AIOps
概要
世界中の何百万ものお客様にクラウドサービスを提供してきた 19 年以上の年月にわたって AWS が蓄積し、磨き上げてきた広範な運用経験を活用しましょう。AWS では、クラウド運用プロセスの強化、加速、自動化を支援するために、AI と機械学習を適用してきました。AIOps により、ワークロードを簡単に観察し、運用上のトラブルシューティングを迅速に行い、運用問題を解決して修正するための措置を講じることができるため、平均復旧時間 (MTTR) の短縮につながります。
問題の根本原因を短時間で特定
運用調査は、AWS マネジメントコンソールのどこからでも開始できます。アラームが発行されると同時に調査を開始するように Amazon CloudWatch を設定したり、Amazon Q チャットから調査を作成したりすることが可能です。CloudWatch はお客様とともに調査を行って、アプリケーション内の異常を特定し、問題の根本原因に関する仮説を立てるための支援を提供します。
修復提案を使用して問題を迅速に解決
Amazon CloudWatch は、関連する AWS Systems Manager Automation ランブック、AWS re:Post 記事、およびドキュメントを明るみにすることで、一般的な AWS 問題に対する修復措置を提案します。ビジネスクリティカルなアプリケーションを完全に機能する状態にすばやく戻すことができるように、ランブックを実行して問題を解決します。
運用体制を継続的に改善
Amazon CloudWatch は、AI を使用して包括的なインシデント後の分析レポートを数分で作成します。インシデントレポートは、構造化されたインシデント後の分析を通じてパターンをよりよく特定し、予防措置を実施して、運用体制を継続的に改善できるようにします。重要な運用テレメトリ、サービス設定、調査結果の収集と相互関連付けを自動的に行って、運用改善を促す詳細なレポートを生成します。
あらゆる経験レベルのオペレーターを後押し
トラブルシューティングの面倒な作業は Amazon CloudWatch が引き受けるため、ユーザーがすべてのアプリケーションリソースの専門家になる必要はありません。運用調査中、CloudWatch は何十万ものデータポイントを綿密に調べてサービス間の関係性を見いだし、サービスが連動する仕組みに関する理解を深めます。調査結果の分析後、CloudWatch は問題の根本原因について考えられる仮説を提示し、問題を解決する方法を詳しく説明します。
異常とパターンを自動的に検出
Amazon CloudWatch は、高度な機械学習を使用してベースラインを自動的に設定し、テレメトリデータ内の異常を検出することで、メトリクスとログを手動で精査する必要をなくします。スパイクや異常なパターンに関するアラートを受け取って、問題が悪化する前に対処します。CloudWatch は、繰り返し発生するパターンと、重大度レベルなどの重要な値を明らかにすることで、関連するログにすばやく焦点を絞ったり、動作の経時的な比較を行って問題をより迅速に発見したりするための支援を提供します。
自然言語を使用してテレメトリデータをクエリ
注目のサービスとソリューション
お客様
Cedar Gate Technologies
ヘルスケアテクノロジーのプロバイダーである Cedar Gate Technologies は、クライアントが患者に有益なケアを継続的に提供できるように調査を加速し、問題を迅速に解決するために Amazon CloudWatch を使用することで、運用問題の根本原因を 2 時間ではなく約 30 分で特定できるようになりました。
Amazon Kindle
Amazon Kindle のサポートエンジニアは、Amazon CloudWatch を調査に使用することで問題解決にかかる時間を 65~80% 短縮しました。これは、エンジニアがお客様のニーズにより迅速に対応して、最高のユーザーエクスペリエンスを提供するために役立ちます。
Amazon Music
Amazon Music の開発者は、Amazon CloudWatch を 24 時間年中無休のアシスタントとして使用して調査を自動化し、問題全体の傾向を特定しています。これは、オンコールシフト中に開発者がより迅速に作業するために役立ちます。早期の使用状況から、Amazon Music が問題を 2 倍速く解決していることがわかっているため、リスナーはお気に入りの曲を中断なしに楽しむことができます。
SmugMug
写真管理プラットフォームである SmugMug は、システム全体でのメトリクス、ログ、運用イベントの自動分析に Amazon CloudWatch を使用しています。これは、SmugMug がほとんどの問題を 20 分未満で、最大 50% 速く診断することを可能にします。手動によるログ検索を低減することで運用効率が向上するため、チームは問題の管理に費やす時間とリソースを減らす一方で、写真家がデジタルストアフロントを成長させるために役立つプラットフォームの構築により多くの時間を費やすことができます。