Amazon Web Services ブログ

新規 – Amazon CloudWatch anomaly detection – 異常検出



Amazon CloudWatch は、「AWS を使用して、高度でスケーラブルで堅牢なウェブアプリケーションをより簡単に構築できるようにする」という願い (当時の私の説明) の一環として、2009 年初めに開始されました。 私たちは長年にわたって CloudWatch の拡張を続けており、現在ではお客様がそれを使用してインフラストラクチャ、システム、アプリケーション、さらにはビジネス指標を監視しています。お客様はカスタムダッシュボードを構築、アラームを設定し、CloudWatch を使用して、アプリケーションのパフォーマンスや信頼性に影響する問題を警告しています。

CloudWatch アラームを使用したことがあれば、アラームのしきい値を設定するにはちょっとしたコツがあることがわかります。トラブルは早期に確実にキャッチしたいですが、間違ったアラームは引き起こしたくありません。成長や規模に対処する必要がありますし、周期的および季節的な動作に対処するために、しきい値を調整および再調整する必要もあります。

異常検出
現在、CloudWatch のアラームをより効果的に使用するのに役立つ新機能で CloudWatch を強化しています。機械学習で強化され、10 年以上の経験に基づいて構築された CloudWatch 異常検出は、12,000 以上の内部モデルにルーツを持っています。手動による設定や実験を回避するのに役立ち、識別可能な傾向またはパターンを持つ任意の標準またはカスタムの CloudWatch メトリクスと組み合わせて使用できます。

異常検出は、選択したメトリクスの履歴値を分析し、毎時、毎日、毎週繰り返される予測可能なパターンを探します。次に、将来の予測を改善し、正常な動作と問題のある動作をより明確に区別するのに役立つ最適なモデルを作成します。必要に応じてモデルを調整および微調整し、同じ CloudWatch メトリクスに対して複数のモデルを使用することもできます。

異常検出の使用
数秒で独自のモデルを作成できます! 24 時間ごとに CPU 使用率が急上昇する EC2 インスタンスがあります。

メトリクスを選択し、[波] アイコンをクリックして、このメトリクスと統計の異常検出を有効にします。

これにより、デフォルト設定でモデルが作成されます。モデルを選択し、ズームインして使用率の急上昇の 1 つを見ると、急上昇が予測帯域に反映されていることがわかります。

このモデルをそのまま使用してメトリクスのアラームを有効化するか、モデルを選択して [モデルの編集] をクリックしてカスタマイズすることができます。

モデルのトレーニングに使用されるデータから特定の時間範囲 (過去または未来) を除外できます。 これは、データが再度発生しない 1 回限りのイベントを反映している場合に有効です。また、データのタイムゾーンを指定することもできます。 これにより、サマータイムの変化に敏感なメトリクスを処理できます。

これを設定した後、異常検出モデルが有効になり、通常どおりアラームを作成するために使用できます。しきい値の種類として異常検出を選択し、異常検出しきい値を使用してバンドの幅を制御します。メトリクスがバンドの外側、バンドより大きい、またはバンドより低いときにアラームを発生させることができます。

残りの手順は、他の種類のアラームを作成するために既に使用している手順と同じです。

知っておくべきこと
この新しい CloudWatch の機能を使用する準備をする際に留意すべきいくつかの興味深い点を以下に示します。

適切なメトリクス – 異常検出は、メトリクスに識別可能なパターンまたは傾向があり、欠落しているデータポイントの数が最小限である場合に最適に機能します。

更新 – モデルが作成されると、新しいメトリクスデータで 5 分ごとに更新されます。

ワンタイムのイベント – モデルでは、ブラックフライデーや休日のショッピングシーズンなどの 1 回限りのイベントは予測できません。

API / CLI / CloudFormation – コンソール、CloudWatch API (PutAnomalyDetector) 、CloudWatch CLI から異常モデルを作成および管理できます。また、AWS CloudFormation テンプレートでAWS::CloudWatch::AnomalyDetector リソースを作成することもできます。

今すぐ利用可能
今すぐ、すべての商用 AWS リージョンで CloudWatch 異常検出の作成と使用を開始できます。詳細については、CloudWatch ドキュメントCloudWatch 異常検出をお読みください。

Jeff