Wie kann ich sicher sein, dass CloudWatch-Alarme Aktionen auslösen?

Lesedauer: 3 Minute
0

Mein Amazon CloudWatch-Alarm wird nicht aktiviert, obwohl ich anhand meiner CloudWatch-Grafiken sehen kann, dass die Alarm-Metrik den konfigurierten Schwellenwert überschreitet. Wie kann ich sicher sein, dass meine CloudWatch-Alarme aktiviert und die Alarmaktionen ausgeführt werden?

Kurzbeschreibung

CloudWatch-Alarme, die zeitaggregierte Metriken (wie etwa Fünf-Minuten-Durchschnittswerte) messen, führen diese Messung kontinuierlich in einem fortlaufenden Fenster durch. Wenn alle während des Evaluierungszeitraums gesammelten Datenpunkte unterhalb des konfigurierten Schwellenwerts liegen, wird der CloudWatch-Alarm nicht aktiviert.

CloudWatch-Alarme starten Aktionen, wenn sich der Alarmstatus ändert und für eine bestimmte Anzahl von Zeiträumen in diesem Zustand verbleibt. Weitere Informationen finden Sie unter CloudWatch-Alarme erstellen.

Wichtig: Zu diesem Verhalten existiert eine Ausnahme für CloudWatch-Alarme, die mit Amazon EC2 Auto Scaling-Aktionen verknüpft sind. Ein CloudWatch-Alarm aktiviert ständig Auto Scaling-Aktionen, wenn sich dieser Alarm in einem bestimmten Status befindet. Dies geschieht auch dann, wenn keine Zustandsänderungen vorgenommen werden und der Alarm in diesem Zustand verbleibt.

Lösung

Berücksichtigen Sie bei der Erstellung von Alarmen unbedingt den Mechanismus, der von CloudWatch zur Messung von zeitaggregierten Metriken verwendet wird.

Erwägen Sie, die Schwellenwerte für Metrik-Daten zu senken, um sicherzustellen, dass der Alarm wie erwartet funktioniert.

Beispiel für die Problembehandlung

In diesem Beispiel liegt ein Alarm vor, der auf der durchschnittlichen CPU-Auslastung basiert. Der Alarm ist mit einem Schwellenwert von > 45 konfiguriert. Es läuft über mindestens drei aufeinanderfolgende Zeiträume von fünf Minuten. Der Evaluierungszeitraum beträgt drei Sekunden und umfasst einen Zeitraum von 300 Sekunden für die folgenden zeitaggregierten Metriken:

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=41.685}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.846}
  • 06:00:00: data: {Avg=61.123}

Diese Datenpunkte führen zu den folgenden Alarmzuständen:

  • 05:35 ALARM
  • 05:40 ALARM
  • 05:45 ALARM zu OK
  • 05:50 OK
  • 05:55 OK
  • 06:00 OK zu ALARM

Der um 05:55 Uhr erfasste Datenpunkt überschreitet den Schwellenwert für die durchschnittliche CPU-Auslastung von 45 %. Der Alarm bleibt jedoch im Zustand OK und aktiviert die Aktion nicht um 05:55 Uhr. Dies liegt daran, dass der um 05:45:00 Uhr erfasste Datenpunkt, der den Schwellenwert nicht überschreitet, um 05:55 Uhr in die Auswertung einbezogen wird. Fünf Minuten später startet der Alarm jedoch die Aktion, da der Alarmstatus um 06:00 Uhr von OK zu ALARM wechselt.

Für die folgenden zeitaggregierten Metriken lautet der Alarmstatus nach 05:35 Uhr ALARM, da alle Datenpunkte den Schwellenwert für die durchschnittliche CPU-Auslastung von 45 % überschreiten. Da es keine Statusänderungen gibt, wird die Alarmaktion nicht aktiviert.

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=45.075}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.847}
  • 06:00:00: data: {Avg=61.123}

Ähnliche Informationen

Dynamische Skalierung für Amazon EC2 Auto Scaling

Verfügbare Metriken anzeigen

AWS OFFICIAL
AWS OFFICIALAktualisiert vor 2 Jahren