내 Amazon CloudWatch 경보가 [ALARM] 상태로 변경되었습니다. 경보 지표를 확인하면 위반 데이터 포인트를 발견할 수 없습니다. 그러나 경보의 이벤트 기록에는 위반 데이터 포인트가 표시됩니다.

CloudWatch 경보는 특정 시점에 사용 가능한 데이터 포인트를 기준으로 지표를 평가합니다. 새 데이터 포인트가 계속해서 CloudWatch 지표로 유입되므로 각 후속 경보 평가는 서로 다른 집계된 데이터 포인트를 사용할 수 있습니다. 알람을 트리거한 위반 데이터 포인트가 표시되지 않는 것은 해당 데이터가 아직 지표로 유입되지 않았기 때문일 수 있습니다. 나중에 이벤트 기록을 검토하면 지표로 데이터가 모두 유입되어 완전한 데이터 포인트 세트를 볼 수 있습니다.

CloudWatch 경보 지표의 그래프에서 위반 데이터 포인트를 관찰하려면 [통계]를 [Maximum/Minimum]으로 변경합니다.

[평가 기간] 및 [Datapoints to Alarm]이 서로 다른 값을 가지는 "N 중 M" 경보를 구성하면 경보가 [ALARM] 상태로 변경되는 것을 방지하는 데 도움이 됩니다. 이 구성을 사용하면 경보에서 집계된 데이터 포인트를 더 많이 평가하며 주어진 데이터 포인트 세트(N)에서 적어도 특정 수의 데이터 포인트(M)가 위반했을 경우에만 경보 상태가 변경됩니다. 자세한 내용은 CloudWatch 지표를 기반으로 CloudWatch 경보 생성CloudWatch 경보가 누락 데이터를 처리하는 방법 구성을 참조하십시오.

위반 데이터 포인트를 관찰하는 방법의 예

예제 경보 구성:

  • 표준 해상도 경보(1분마다 지표 평가)
  • [지표 ] = [CPUUtilization]
  • [임계값] = [65%]
  • [통계] = [평균]
  • [기간] = [60초]
  • [평가 기간] = [1]
  • Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스에 대한 [세부 모니터링] = [활성]

예제 경보 평가 기간(12:00:00 – 12:01:00 UTC)이 시작되면 다음과 같은 데이터 포인트를 지표에 사용할 수 있습니다.

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336

이러한 데이터 포인트의 평균은 66.934로서, 임계값인 65%를 위반합니다. 따라서 [ALARM] 상태의 변경이 트리거됩니다. 경보의 이벤트 기록에는 집계된 데이터 포인트 중 임계값을 초과하는 데이터 포인트가 상태 변경의 이유로 나열됩니다.

경보를 나중에 다시 평가하면 추가 데이터 포인트가 12:00:00 – 12:01:00 UTC 분 기간에 유입된 것을 볼 수 있습니다. 예:

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336
Sample-5: 12:00:37 UTC, data-point: 15.18181818181819
Sample-6: 12:00:41 UTC, data-point: 10.26490

새 데이터 포인트의 평균은 48.864로서, 임계값인 65%를 위반하지 않습니다. 경보는 이제 [OK] 상태로 변경됩니다. 경보의 이벤트 기록에는 임계값 미만의 집계된 데이터 포인트가 상태 변경의 이유로 나열됩니다.

경보가 트리거되어도 지금은 CloudWatch 지표의 그래프에 위반 데이터 포인트가 보이지 않을 수 있습니다. [CPUUtilization] 지표의 그래프를 보면 [평균]이 66.934가 아니라 48.864로 나열되어 있습니다. 이는 이제 평가를 위한 모든 관련 데이터 포인트가 지표로 유입되었기 때문입니다.

CloudWatch 지표 그래프의 [통계]를 [최대]로 변경하면 이제 12:00:00 UTC에 위반 데이터 포인트 95.473이 표시된 것을 볼 수 있습니다.

참고: 데이터가 임계값 아래로 떨어질 때 경보가 트리거되도록 구성한 경우 CloudWatch 지표 그래프의 [통계]를 [최소]로 변경하십시오.

"N 중 M" 경보를 구성하는 방법의 예

예제 경보 구성:

  • 표준 해상도 경보(1분마다 지표 평가)
  • [지표 ] = [CPUUtilization]
  • [임계값] = [65%]
  • [통계] = [평균]
  • [기간] = [120초]
  • [평가 기간] = [3 중 2]
  • 모니터링되는 EC2 인스턴스에 대한 [세부 모니터링] = [활성]

이 예제 경보 구성은 첫 번째 예와 비슷합니다. 그러나 평가 기간은 경보를 트리거하기 전에 사용 가능한 데이터 포인트 3개 중 2개를 확인합니다. 평가 기간이 증가했기 때문에 기간도 감소되었습니다.

경보 기간이 12:00:00 UTC에 시작되면 다음과 같은 데이터 포인트를 CloudWatch 지표에서 사용할 수 있습니다.

Sample-1: 12:00:07 UTC, data-point: 89.76470588235294
Sample-2: 12:00:11 UTC, data-point: 27.926666666666664
Sample-3: 12:00:19 UTC, data-point: 54.57142857142857
Sample-4: 12:00:35 UTC, data-point: 95.473333333333336

CloudWatch는 증가된 평가 기간 때문에 12:00:00 UTC보다 오래된 데이터 포인트를 찾습니다.

11:58:00 UTC, Average=41.874304539920
11:59:00 UTC, Average=5.230773650991253
12:00:00 UTC, Average=66.93403361344538

12:00:00 UTC에 집계된 데이터 포인트는 임계값을 위반합니다. 그러나 경보는 [OK] 상태를 유지되고 [ALARM] 상태로 변경하지 않습니다. 이러한 동작이 발생하는 이유는 데이터 포인트 3개 중 2개가 임계값을 위반해야 경보가 트리거되는데 3개 중 1개만 위반했기 때문입니다.


페이지 내용이 도움이 되었습니까? | 아니요

AWS 지원 지식 센터로 돌아가기

도움이 필요하십니까? AWS 지원 센터를 방문하십시오.

게시 날짜: 2019년 3월 5일