Amazon Web Services ブログ

Amazon DevOps Guru が一般サービス提供開始となり東京リージョンでもお使いいただけます

みなさん、こんにちは。アマゾン ウェブ サービス ジャパン、シニアエバンジェリストの亀田です。

2020年の re:Invent でアナウンスされた Amazon DevOps Guru が一般サービス提供開始となり、東京リージョンでもご利用いただけますのでお知らせいたします。

Amazon DevOps Guru

DevOps Guru はアプリケーションの可用性を向上させる 機械学習 駆動のクラウドオペレーションサービスであり、これを用いることでアプリケーションの運用パフォーマンスと可用性を簡単に向上させることができます。機械学習が通常の運用パターンを学習し、そこから逸脱した動作を検出し、迅速に運用上の問題を特定することができます。例えば、異常なアプリケーションの動作となる、レイテンシーの増加、エラー率、リソースの制約などを特定し、ダッシュボードに情報を集約させ、さらに、アラートを管理者に自動的に送信し、関連する異常の概要、考えられる根本原因、および問題が発生した時期と場所に関する情報を提供します。そして、可能な場合、DevOps Guru は、問題を修正する方法に関する推奨事項もあわせて提供するため、運用者は問題の特定と修正アクション開始が容易になります。

DevOps Guru は、Amazon CloudWatchAWS ConfigAWS CloudFormationAWS X-Ray などの複数のソースからの運用データを継続的に分析および統合し、運用データの異常を検索して視覚化を行い、以下のような、単一のコンソールダッシュボードを提供します。

ダッシュボードに集約された情報はさらに、個別の項目をドリルダウンしていくことが可能で、問題が検知された日時、その原因の推察、対処方法の推奨項目などが以下に表示されます。

発見された問題は、DevOps GuruとAmazon SNSの連携により、管理者に通知を自動で送出するや、サードパーティツールとの連携を構築することが可能です。

DevOps Guru はVPC エンドポイントを用いることで、VPC内部から検知された異常の詳細を取得可能なAPIに対してセキュアにアクセスさせることが可能です。

AWS CloudFormation との連携と予防的/事後的インサイト

DevOps Guru でリソースを監視対象に設定させるためには、2種類の設定方法があります。設定を行うAWSアカウントの当該リージョンでサポートされているすべてのリソースを監視対象に含める方法と、個別にCloudFormationでリソース群を指定する方法です。CloudFormationで管理されていないリソースを個別に管理対象に登録はできないことに留意してください。DevOps Guru がサポートするリソースは、AWS Lambda を中心としたサーバレスサービス群だけではなく、Amazon EC2 やAmazon RDSAmazon S3等幅広いAWSのサービスをサポートしています。

2020年 re:Invent でのアナウンス後提供されていたプレビューでは、問題が発生してからインサイトが提供される、事後的インサイト、の機能のみが提供されていましたが、一般サービス提供開始時点で新たに、予防的インサイト、が提供されるようになります。この予防的インサイトは運用上のデータメトリックスをもとに、将来発生すると予測される問題に対処するための推奨事項が出力されます。例えば、ディスク使用率などの有限のリソースメトリックを監視し、日々の増加状況からディスクキャパシティにかかわる問題が発生することを予測し、ダッシュボードに問題を出力します。

上記のように1方向にデータが遷移するパターンは検知が容易ですが、例えば定期的なスパイクを迎えているシステムの場合、一時的なリクエスト増は定常状態にあるとも言えます。このようなデータを取り扱う場合、一般的な閾値モデルでは対処が難しいケースがあります。DevOps Guru は機械学習を異常検知に用いるため、そのデータ増が異常なのか定常的なものなのかを自動で判別します。

これはAPIリクエストの定常的なスパイクを記録したグラフです。このようなケースではDevOps Guru はこのスパイクを定常的なものと認識します。

詳しくはこちらをご覧ください。

– シニアエバンジェリスト 亀田