即使我从 CloudWatch 图表中看到警报指标超出配置的阈值,也没有触发我的 Amazon CloudWatch 警报。如何确保触发 CloudWatch 警报并执行警报操作?

评测时间聚合指标(例如 5 分钟平均值)的 CloudWatch 警报会以滚动窗口的方式连续执行评测。如果在评估期内收集到的所有数据点均未超过配置的阈值,就不会触发 CloudWatch 警报。

只有在警报状态发生更改并在指定的周期数内保持该状态时,CloudWatch 警报才会触发操作。有关更多信息,请参阅创建 CloudWatch 警报

重要提示:对于与 Amazon EC2 Auto Scaling 操作关联的 CloudWatch 警报,此行为有一个例外。当警报处于指定状态时,CloudWatch 警报会持续触发 Auto Scaling 操作,即使未发生状态更改且警报仍保持该状态也是如此。

务必在创建警报时考虑 CloudWatch 用于评测时间聚合指标的机制。

另请考虑降低指标数据阈值,以确保警报按预期工作。

故障排除示例

在本示例中,您将根据平均 CPU 利用率发出警报。对于以下时间聚合指标,警报配置为在至少连续三个五分钟周期(评估周期数为 3 个,每个周期 300 秒)内超过阈值的 45% 时触发操作:

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=41.685}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.846}
  • 06:00:00: data: {Avg=61.123}

这些数据点会导致以下警报状态:

  • 05:35 ALARM
  • 05:40 ALARM
  • 05:45 ALARM 到 OK
  • 05:50 OK
  • 05:55 OK
  • 06:00 OK 到 ALARM

在 05:55 收集的数据点超过平均 CPU 利用率阈值的 45%。但是,警报仍然处于 OK 状态,并且不会在 05:55 触发操作。这是因为在 05:45:00 收集的数据点未超出此阈值,而且此数据点包含在 05:55 的评估中。但 5 分钟后,警报会触发操作,因为警报状态在 06:00 已从 OK 更改为 ALARM。

对于以下时间聚合指标,警报状态在 05:35 之后为 ALARM,因为所有数据点均超过了平均 CPU 利用率阈值的 45%。由于没有任何状态更改,因此不会触发警报操作。

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=45.075}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.847}
  • 06:00:00: data: {Avg=61.123}

此页内容对您是否有帮助? |

返回 AWS Support 知识中心

需要帮助? 请访问 AWS 支持中心

发布时间:2018 年 10 月 31 日