Amazon CloudWatch アラームが ALARM 状態に変更されてしまう。アラームのメトリクスを確認しても、データポイントの超過が、まったく表示されない。ただし、アラームのイベント履歴には、データポイントの超過があったと表示される。

CloudWatch のアラームは、特定の時点において、メトリクスをデータポイントを基準にして評価します。連続するアラームの評価は、別々に収集されたデータポイントで行われる事があります。なぜなら、CloudWatch メトリックスには、継続的にデータポイントが流れ込むからです。新たなデータが、まだメトリックスに到達していない場合、アラームをトリガーした超過データポイントを確認できない事があります。それが、メトリックスに到達した後、イベント履歴を確認すれば、完全なデータポイントのセットを見る事ができます。

CloudWatch アラーム内のメトリクスグラフで、超過データポイントを確認するには、 [Statistic] を [Minimum/Maximum] に変更し ます。

[Evaluation Period] と [Datapoints to Alarm] の設定を "M out of N" に変更する事で、アラームの状態が、ALARM へされてしまうのを防ぐ事ができます。この設定は、アラームがより多くのデータポイントを集約してから評価するように変更します。アラームステートが変わるのは、設定されたデータポイント数 (N) の内、一定数 (M) 以上の超過データポイントがある場合のみです。詳細については、「CloudWatch メトリクスに基づいて CloudWatch アラームを作成する」および「Configuring How CloudWatch Alarms Treat Missing Data」を参照してください。

超過データポイントを確認する方法の例

アラームの設定例

  • 標準間隔アラーム(1 分ごとにメトリクスを評価)
  • [Metric] から [CPUUtilization] を選択
  • [Threshold] を [65%] に設定
  • [Statistic] から [Average] を選択
  • [Period] を 60 seconds に設定
  • [Evaluation Period] を [1] に設定
  • モニタリングした Amazon Elastic Compute Cloud (Amazon EC2) インスタンスの場合、詳細モニタリング有効になります。

この例では、12:00:00-12:01:00 UTC に設定されたアラーム評価が開始すると、次のデータポイントがメトリクスで利用可能になります。

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336

しきい値である 65% を超過するデータポイント数の平均は、66.934 です。この事により ALARM 状態がトリガーされます。アラームイベント履歴には、アラームステート変更の理由として、しきい値を超過していた収集済みデータポイントの一覧が表示されます。

後にアラームを再確認すると、12:00:00 ~12:01:00 UTC の1分間に、データポイントが新たに流れ込んでいるのがわかります。例

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336
Sample-5: 12:00:37 UTC, data-point: 15.18181818181819
Sample-6: 12:00:41 UTC, data-point: 10.26490

しきい値 65% を超過していない、新しいデータポイント数の平均が48.864個だったこの場合は、アラームが OK 状態に変更されます。アラームイベント履歴には、アラームステート変更の理由として、しきい値以下であったデータポイントが一覧表示されます。

この時、アラームがトリガーされていたとしても、CloudWatch メトリックスのグラフに、超過したデータポイントが表示されない場合があります。[CPUUtilization] メトリクスのグラフを表示すると、[Average] には、 (66.934 ではなく) 48.864 と表示 されます。これは、評価されるべきすべてのデータポイントが、この時点までにメトリックスに到達したからです。

CloudWatch メトリクスグラフの[Statistic] を [Maximum] に変更すると、12:00:00 UTC に、95.473 個の超過データポイントがあった事を確認できます。

注 : データが、しきい値を下回った時トリガーするようにアラームが設定されている場合は、CloudWatch メトリックスグラフの [Statistic] を [Minimum] に変更します。

"M out of N" のアラーム設定をする例

アラームの設定例

  • 標準間隔アラーム(1 分ごとにメトリクスを評価)
  • [Metric] から [CPUUtilization] を選択
  • [Threshold] を [65%] に設定
  • [Statistic] から [Average] を選択
  • [Period] を [120 seconds] に設定
  • [Evaluation Period] から [2 out of 3] を選択
  • モニタリングされた EC2 インスタンスの場合は、詳細モニタリング有効になります。

この、アラーム設定例は、最初に示した例に似ています。ただし、各評価期間において、対象となるデータポイント 3 個のうち 2個 をチェックした後、アラームをトリガーしている事に注意してください。また、評価期間が延長されているため、その回数は削減されます。

アラーム期間が 12:00:00 UTCに開始すると、その後のデータポイントが CloudWatch メトリックスで利用できるようになります。

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336

評価期間が延長されているため、CloudWatch は 12:00:00 UTC より前のデータポイントを探します。

11:58:00 UTC, Average=41.874304539920
11:59:00 UTC, Average=5.230773650991253
12:00:00 UTC, Average=66.93403361344538

ここで、12:00:00 UTC に集約されたデータポイントがしきい値を超過していたとします。しかし、アラームの状態は OK のまま維持され、ALARM 状態に変化しません。この動作が発生するのは、3 個のデータポイントのうち 1 個だけしきい値を超過しているためです。 アラームをトリガーするには、3 個の内 2 個の超過が必要です。


このページは役に立ちましたか? はい | いいえ

AWS サポートナリッジセンターに戻る

サポートが必要ですか? 「AWS サポートセンター」をご覧ください。

公開日: 2017 年 3 月 5 日