Amazon DevOps Guru

アプリケーションの可用性を向上させる ML 駆動のクラウドオペレーションサービス

Amazon DevOps Guru は、アプリケーションの運用パフォーマンスと可用性を簡単に向上させる、機械学習 (ML) を利用したサービスです。DevOps Guru は、通常の運用パターンから逸脱した動作を検出するため、顧客に影響を与える前に迅速に運用上の問題を特定できます。

DevOps Guru は、長年の Amazon.com と AWS の優れた運用によって通知された機械学習モデルを使用して、異常なアプリケーションの動作 (レイテンシーの増加、エラー率、リソースの制約など) を特定し、潜在的な停止やサービスの中断を引き起こす可能性のある重大な問題を明らかにします。DevOps Guru が重大な問題を特定すると、アラートを自動的に送信し、関連する異常の概要、考えられる根本原因、および問題が発生した時期と場所に関するコンテキストを提供します。可能な場合、DevOps Guru は、問題を修正する方法に関する推奨事項も提供します。

DevOps Guru は、AWS アプリケーションから運用データを自動的に取り込み、運用データの問題を視覚化する単一のダッシュボードを提供します。DevOps Guru を使い始めると、手動でのセットアップや機械学習に関する専門知識がなくても、アプリケーションの可用性と信頼性を向上させることができます。

DevOps_Guru_Dashboard
Amazon DevOps Guru ダッシュボード
 拡大イメージを見る
DevOps_Guru_Dashboard

利点

2_icon_2_resolve_issues

運用上の問題を自動的に検出する

機械学習を使用して、Amazon DevOps Guru は、アプリケーションメトリック、ログ、イベントなどのデータを自動的に収集して分析し、通常の動作パターンから逸脱した動作を識別します。差し迫ったリソースの枯渇、停止、メモリリーク、プロビジョニング不足のコンピューティング容量、データベース I/O の過剰使用を引き起こす可能性のあるコードと構成の変更など、運用上の問題とリスクを自動的に検出して警告します。

2_icon_1_auto_detect

ML を活用した洞察で問題を迅速に解決する

Amazon DevOps Guru は、異常な動作と運用イベントを相互に関連付けることで、問題の根本原因を特定して解決する時間を短縮します。DevOps Guru は、問題が発生すると、関連する異常の要約、問題に関するコンテキスト情報を使用して洞察を生成し、可能な場合は、修正のための実用的な推奨事項を提供します。

2_icon_3_easily_scale

可用性を簡単に拡張および維持する

Amazon DevOps Guru は、静的ルールとアラームを手動で更新するための時間と労力を節約するため、複雑で進化するアプリケーションを効果的に監視できます。新しい AWS サービスを移行または採用すると、DevOps Guru はそれらのメトリック、ログ、およびイベントを自動的に分析します。次に、洞察を生み出し、変化する動作や進化するシステムアーキテクチャに簡単に適応できるようにします。

2_icon_4_reduce_noise

ノイズとアラームの疲労を軽減する


Amazon DevOps Guru は、事前にトレーニングされた機械学習モデルを使用して関連する異常を関連付けてグループ化し、最も重要なアラートを表示することで、デベロッパーと IT 運営者がアラームのノイズを減らし、アラームによる疲労を克服できるよう支援します。DevOps Guru を使用すれば、複数の監視ツールとアラームを管理する必要性を減らし、問題の根本原因と修復に集中できます。

仕組み

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


Amazon DevOps Guru のプレビュー

ユースケース

運用上の監査

Amazon DevOps Guru を使用すれば、重大度によって識別され、並べ替えられた、運用上重要なすべてのイベントの概要をすばやく取得できます。システム正常性のダッシュボードを使用すると、特定のアプリケーション問題を検索し、傾向を特定し、デベロッパーが時間とリソースをどこに費やすべきかを決定できます。

リソースの枯渇に対する事前対応プラン

メモリ、CPU、ディスク容量などの枯渇性リソースの予測アラームを作成します。Amazon DevOps Guru は、リソース使用率がプロビジョニングされた容量を超える時期を予測し、通知を作成してダッシュボードに送信して、差し迫っている停止を回避します。

予防メンテナンス

Amazon DevOps Guru を使用すれば、インシデントが発生する前に防ぐことができます。DevOps Guru は、結果が重大ではない (中程度や低程度の重大度) 場合にフラグを立てますが、そのままにしておくと、時間の経過とともに悪化し、アプリケーションの可用性に影響を与えます。これにより、優先順位を付け、予期しないダウンタイムを回避することができます。たとえば、DevOps Guru は、Auto Scaling グループの制限に達したこと、レイテンシーパターンの変更、または API 呼び出し量の増加について通知を行います。DevOps Guru は、アプリケーションの全体的な可用性を向上させるのに役立つ AWS のベストプラクティスも特定しています。 

お客様

NextRoll
「私たちは何千もの EC2 インスタンスを実行しており、チームが運用上の問題を解決するために費やす時間を減らす方法を常に模索しています。Amazon DevOps Guru を使用し、ML を活用した洞察を活用して、運用上の問題を特定、関連付け、修正できることをうれしく思います。これにより、チームは時間を節約し、平均修復時間 (MTTR) を短縮することができます」

- Valentino Volonghi
CTO、NextRoll

SmugMug
「私のチームは、ops-for-life のモットーに従っているため、手動でのアクティビティを自動化する方法を常に探しています。Amazon DevOps Guru を使用して、その目標を実現し、AIOps が日常タスクの多くを引き継ぐようにして、チームが IT イノベーションに専念できるようにしたいと考えています。私たちは今、ビジネスのニーズを満たせるだけでなく、最も重要なことに専念できる時間が増えたので、組織と顧客に価値をもたらすことで、さらに成長を遂げることができます」

- Andrew Shieh
SmugMug 運用責任者

Thomson Reuters
「顧客体験は私たちにとって不可欠なものです。可用性、パフォーマンス、そして変更リクエストに関するアラートの複数のソースに対処することで、お客様に影響を与えるインシデントを防いだり軽減したりしようとする場合に、顧客の体験が課題となる可能性があります。Amazon DevOps Guru を使用し、ML を活用した洞察を活用して、行動への明確な道筋を提供できることをうれしく思います。これにより、問題を迅速に軽減し、お客様に影響を与えるイベントを回避できます。PagerDuty との統合はいわゆるボーナスですね。適切な人にタイムリーかつ効率的に推奨事項を提供できるからです」

- Steve Thoennes
ディレクターのインフラストラクチャホスティングポートフォリオ

パートナー

Atlassian
「Atlassian は、DevOps Guru を立ち上げる際に Amazon をサポートし、チームがコードをデプロイして、自信を持ってサービスを運用できるよう支援したことを誇りに思っています。新しい Opsgenie と Jira Service Management の統合により、DevOps Guru が潜在的な問題を予測したり、インシデントが発生したと判断したりすると、適切なチームにすぐに通知が届きます。DevOps Guru は洞察における新しい次元を提供し、Atlassian は最速の応答を保証します」

- Emel Dogrusoz
Opsgenie 製品責任者

PagerDuty
「PagerDuty は、インシデント対応のライフサイクル全体を解決策で自動化することにより、DevOps 文化への移行を推進するために構築されました。最新の Amazon DevOps Guru との統合により、DevOps への取り組みを継続できることを嬉しく思います。PagerDuty は、数十年にわたる Amazon の優れた運用性と DevOps Guru の機械学習機能を活用して、共同のお客様にさらにリアルタイムの信号作用機能を提供します。PagerDuty が DevOps Guru の Amazon Simple Notification Service (SNS) 通知を取り込むことで、AWS のお客様は、お客様に影響を与えるような停止が起こる前に、運用上の問題に対してリアルタイムのアクションを実行できます」

- Jonathan Rende
製品 SVP

7_bottom_promo_icon

コードレビューの自動化
Amazon CodeGuru を活用して、コードの問題をより迅速、より早期に見つける

Product-Page_Standard-Icons_01_Product-Features_SqInk
製品の特徴を見る

高度なパーソナライゼーション機能を
アプリケーションに簡単に組み込む

詳細 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Product-Page_Standard-Icons_03_Start-Building_SqInk
AWS コンソールで構築を開始する

AWS マネジメントコンソールで Amazon DevOps Guru の構築を始めましょう。

サインイン