Amazon DevOps Guru

アプリケーションの可用性を向上させる ML 駆動のクラウドオペレーションサービス

Amazon DevOps Guru は、アプリケーションの運用パフォーマンスと可用性を簡単に向上させる、機械学習 (ML) を利用したサービスです。DevOps Guru は、通常の運用パターンから逸脱した動作を検出するため、顧客に影響を与える前に迅速に運用上の問題を特定できます。

DevOps Guru は、長年の Amazon.com と AWS の優れた運用によって通知された機械学習モデルを使用して、異常なアプリケーションの動作 (レイテンシーの増加、エラー率、リソースの制約など) を特定し、潜在的な停止やサービスの中断を引き起こす可能性のある重大な問題を明らかにします。DevOps Guru が重大な問題を特定すると、アラートを自動的に送信し、関連する異常の概要、考えられる根本原因、および問題が発生した時期と場所に関するコンテキストを提供します。可能な場合、DevOps Guru は、問題を修正する方法に関する推奨事項も提供します。

DevOps Guru は、AWS アプリケーションから運用データを自動的に取り込み、運用データの問題を視覚化する単一のダッシュボードを提供します。CloudFormation スタックまたは AWS アカウントからカバレッジを選択することで、DevOps Guru の使用を開始して、手動のセットアップや機械学習の専門知識がなくても、アプリケーションの可用性と信頼性を向上させることができます。

7,200 時間の AWS リソースの無償提供

リソースグループ A と B にそれぞれ

/月 (AWS 無料利用枠 3 か月間)

利点

2_icon_2_resolve_issues

運用上の問題を自動的に検出する

機械学習を使用して、Amazon DevOps Guru は、アプリケーションメトリクス、ログ、イベント、通常の動作パターンから逸脱した動作などのデータを自動的に収集して分析します。差し迫ったリソースの枯渇、停止、メモリリーク、プロビジョニング不足のコンピューティング容量、データベース I/O の過剰使用を引き起こす可能性のあるコードと構成の変更など、運用上の問題とリスクを自動的に検出して警告します。

2_icon_1_auto_detect

ML を活用したインサイトで問題を迅速に解決する

Amazon DevOps Guru は、異常な動作と運用イベントを相互に関連付けることで、問題の根本原因を特定して解決する時間を短縮します。DevOps Guru は、問題が発生すると、関連する異常の要約、問題に関するコンテキスト情報を使用して洞察を生成し、可能な場合は、修正のための実用的な推奨事項を提供します。

2_icon_3_easily_scale

可用性を簡単に拡張および維持する

Amazon DevOps Guru は、静的ルールとアラームを手動で更新するための時間と労力を節約するため、複雑で進化するアプリケーションを効果的に監視できます。新しい AWS サービスを移行または採用すると、DevOps Guru はそれらのメトリック、ログ、およびイベントを自動的に分析します。次に、洞察を生み出し、変化する動作や進化するシステムアーキテクチャに簡単に適応できるようにします。

2_icon_4_reduce_noise

ノイズとアラームの疲労を軽減する


Amazon DevOps Guru は、事前にトレーニングされた機械学習モデルを使用して関連する異常を関連付けてグループ化し、最も重要なアラートを表示することで、デベロッパーと IT 運営者がアラームのノイズを減らし、アラームによる疲労を克服できるよう支援します。DevOps Guru を使用すれば、複数の監視ツールとアラームを管理する必要性を減らし、問題の根本原因と修復に集中できます。

仕組み

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


Amazon DevOps Guru で運用上のインサイトを得る

ユースケース

運用パフォーマンスと可用性の向上

Amazon DevOps Guru を使用すれば、運用上のインシデントが発生する前に防ぐことができます。DevOps Guru は、重大ではないかもしれない中程度および低い重大度の結果を表面化させますが、そのままにしておくと、時間の経過とともにアプリケーションの信頼性に影響を与えます。例えば、DevOps Guru は、Auto Scaling グループの制限に達したこと、レイテンシーパターンの変更、または API 呼び出し量の増加について通知し、問題が重大になる前に対処できるようにします。

新しいリソースやメトリクスを動的に発見

アプリケーションが進化し、サポートされる新しいリソースが追加されると、DevOps Guru は新しいメトリクスごとにパターンを学習し、運用上の問題について早期に警告します。DevOps Guru がこうしたリソースからメトリクスを取り込み、自動的に分類するため、誤って構成されたアラームを更新または修正する必要がなくなります。 

平均修復時間 (MTTR) を短縮

DevOps Guru の運用上のインサイトを活用することで、問題をすばやく診断して修正できます。こうしたインサイトは、影響を受けるリソース、関連する異常についての関連情報を使用してダウンタイムを削減するのに役立ち、ログや関連イベントなどのコンテキストデータを使用して問題を修正する方法に関する推奨事項を提供します。

プロアクティブなリソース管理

DevOps Guru を使用すると、メモリ、CPU、ディスク容量などの枯渇性リソースがプロビジョニングされた容量を超える時期を特定できます。DevOps Guru は、AWS で実行されるリソースやアプリケーションを継続的に取り込んで、分析し、ダッシュボードに低ノイズの通知を作成することで、差し迫った停止を回避するのに役立ちます。

お客様

SmugMug
「私たちは常に、チームが運用上の問題の解決に費やす時間を短縮する方法を探しています。現在、Amazon DevOps Guru を使用し、ML によるインサイトを活用して、運用上の問題を迅速に特定、関連付け、修正するのに役立てています。Amazon DevOps Guru が提供するインサイトにより、私たちのチームは、トラブルの根本的原因を突き止めようとして最初から始める必要なしに、問題をすばやく見つけることができるようになりました。私たちの IT チームは、平均修復時間 (MTTR) を大幅に短縮し、問題の解決に費やす時間を節約しながら、お客様に可能な限り最高のエンドユーザーエクスペリエンスを提供しています。」

- Anchal Gupta 氏
シニアテクニカルリード、DevOps

Thomson Reuters
「顧客体験と顧客満足度は私たちの最優先事項です。アラートや監視イベントの複数のソースを受信した場合、顧客に影響を与えるインシデントを特定するためにノイズをフィルタリングすることは困難で時間がかかる可能性があります。Amazon DevOps Guru を使用すると、ML によるインサイトを活用して、問題がお客様に与える影響を軽減し、多くの場合は排除するための明確なアクションパスを提供できます。Amazon DevOps Guru と PagerDuty の統合により、適切な人に適切なタイミングで迅速かつ効率的に推奨事項を提供するための直接的なパスが提供され、その結果、運用のダウンタイムが大幅に削減されると予想されます。」

- Steve Thoennes 氏
ディレクターのインフラストラクチャホスティングポートフォリオ

605 社の
「当社の場合、監視する必要がある多数の AWS アカウントと数万のリソースがあります。Infrastructure as Code を使用し、こうしたサービスの動的アラートを作成したとしても、問題を迅速に解決するためにメトリクスを管理および相互に関連付けることは困難です。Amazon DevOps Guru を使用すると、受信するアラートや通知は、複数のサービス間で相関する機械学習を利用した正確なメトリクスであると確信できます。Amazon DevOps Guru の統合は、実装に数分しかかからず、数千の AWS CloudFormation スタックと統合するのも簡単でした。Amazon DevOps Guru は、インフラストラクチャロードマップに焦点を合わせるのに役立つインサイトを提供してくれました。」

- Jared Williams 氏
DevOps 担当ディレクター

パートナー

Atlassian
「Atlassian は、お客様が Amazon DevOps Guru を使用して AIOps 戦略を実装し、クラウドアプリケーションの運用パフォーマンスを管理していることを高く評価しています。当社の新しい Opsgenie と Jira Service Management の統合により、Amazon DevOps Guru が潜在的な問題を発見するとすぐに適切なチームに通知され、機械学習 (ML) を使用してインシデントの重大度に応じた優先順位が付けられます。この統合により、すべてのチームが迅速に対応し、ML を活用した推奨事項を使用して解決し、すべてのインシデントから学ぶことができます。」

- Emel Dogrusoz 氏
Opsgenie 製品責任者

Amazon DevOps Guru を Atlassian Opsgenie と統合することにより、運用上の洞察を待機チームに直接提供する方法についてご覧ください
PagerDuty
「PagerDuty は、Amazon DevOps Guru との新しい統合により、AWS とのパートナーシップをさらに深めています。PagerDuty のデジタル運用管理プラットフォームは、DevOps 文化への移行を推進できるように構築されており、この統合によりこの取り組みをさらに継続できることを嬉しく思っています。PagerDuty は、DevOps Guru の機械学習機能を活用して、共同のお客様にさらにリアルタイムの信号作用機能を提供します。PagerDuty が DevOps Guru の Amazon SNS を取り込むことで、AWS のお客様は、お客様に影響を与えるような停止が起こる前に、運用上の問題に対してリアルタイムのアクションを実行できます」

- Jonathan Rende 氏
製品 SVP

PagerDuty と Amazon DevOps Guru を通じて、機械学習を活用した運用上の洞察を待機チームに提供するための詳しい方法

ブログ投稿と記事 >>

devops guru 1a

新機能 - Amazon DevOps Guru を使用して、アプリケーションのエラーと修正を特定する

2020 年 12 月

Harunobu Kameda

ブログを読む

devops guru 2

AWS CloudFormation StackSets を使用して、複数のアカウントとリージョンにわたって Amazon DevOps Guru を簡単に設定する

2020 年 12 月

Nikunj Vaidya と Nuatu Tseggai

ブログを読む

devops guru reinvent thumbnail

AWS re:Invent 2020: Amazon DevOps Guru を使用して、機械学習を活用したインサイトでアプリケーションの可用性を向上させる

2020 年 12 月

Jacob Sullivan

オンラインセミナーを見る

devops guru 4

Amazon DevOps Guru は、優れた運用性をエンコードする事前トレーニング済みの機械学習モデルを搭載

2020 年 2 月

Caner Turkmen、Ravi Turlapati と Tim Januschowski

ブログを読む

7_bottom_promo_icon

コードレビューの自動化
Amazon CodeGuru を活用して、コードの問題をより迅速、より早期に見つける

Standard Product Icons (Features) Squid Ink
製品の特徴を見る

アプリケーションの運用パフォーマンスと可用性を簡単に向上させる

詳細 
Sign up for a free account
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Standard Product Icons (Start Building) Squid Ink
AWS コンソールで構築を開始する

AWS マネジメントコンソールで Amazon DevOps Guru の構築を始めましょう。

サインイン