Amazon CloudWatch 그래프에서 경보 지표가 구성된 임계값을 초과하는 것을 볼 수 있지만 CloudWatch 경보가 활성화되지 않았습니다. CloudWatch 경보가 활성화되어 있고 경보 작업을 수행하고 있는지 확인하고 싶습니다.
간략한 설명
CloudWatch 경보는 롤링 윈도우에서 시간 집계 지표를 지속적으로 감시합니다. 평가 기간 동안 수집된 모든 데이터 포인트가 구성된 임계값을 초과하지 않으면 CloudWatch 경보가 활성화되지 않습니다.
CloudWatch 경보는 경보 상태가 변경될 때 작업을 시작하고 지정된 기간 동안 유지됩니다. 자세한 내용은 Amazon CloudWatch 경보 사용을 참조하세요.
중요: 경보가 지정된 상태에 있는 경우 CloudWatch 경보는 Amazon EC2 Auto Scaling 작업을 지속적으로 활성화합니다. 상태가 변경되지 않고 경보가 지정된 상태로 유지되면 활동이 계속됩니다.
해결 방법
경보를 생성할 때 시간 집계 지표를 측정하려면 CloudWatch에서 사용하는 메커니즘을 확인합니다.
경보가 올바르게 작동하는지 확인하려면 지표 데이터 임계값을 낮춥니다.
문제 해결 예시
다음 예제에서 경보는 평균 CPU 사용률을 감시합니다. 경보는 45보다 큰 임계값과 5분의 기간으로 구성됩니다. Evaluation Period와 Datapoints to Alarm은 모두 3입니다. 가장 최근 3개 연속 기간의 모든 기존 데이터 포인트가 임계값을 초과하면 경보가 ALARM 상태로 변경됩니다. 알람은 5분씩 3회 연속 실행됩니다.
평가 간격은 시간 집계 지표에 대해 15분입니다.
- 05:25:00: 데이터: {평균=61.123}
- 05:30:00: 데이터: {평균=57.847}
- 05:35:00: 데이터: {평균=60.503}
- 05:40:00: 데이터: {평균=55.473}
- 05:45:00: 데이터: {평균=41.685}
- 05:50:00: 데이터: {평균=58.390}
- 05:55:00: 데이터: {평균=57.846}
- 06:00:00: 데이터: {평균=61.123}
자세한 내용은 경보 평가를 참조하세요.
이전의 데이터 포인트들로 인해 다음과 같은 경보 상태가 발생합니다.
- 05:35 경보
- 05:40 경보
- 05:45 경보에서 OK로
- 05:50 OK
- 05:55 OK
- 06:00 OK에서 경보로
05:55에 수집된 데이터 포인트가 평균 CPU 사용률 임계값인 45%를 초과합니다. 그러나 경보는 OK 상태로 유지되며 05:55에 작업을 활성화하지 않습니다. 05:45:00에 수집된 데이터 포인트는 임계값을 초과하지 않고 05:55에 평가에 포함되므로 아무 작업도 수행되지 않습니다. 5분 후 06:00에 알람 상태가 OK에서 ALARM으로 변경되기 때문에 알람이 작업을 시작합니다.
다음 시간 집계 지표의 경우 데이터 포인트가 평균 CPU 사용률 임계값인 45%를 초과하므로 05:25:00 후에 경보 상태가 ALARM으로 변경됩니다. 상태 변경이 없기 때문에 경보 작업이 활성화되지 않습니다.
- 05:25:00: 데이터: {평균=61.123}
- 05:30:00: 데이터: {평균=57.847}
- 05:35:00: 데이터: {평균=60.503}
- 05:40:00: 데이터: {평균=55.473}
- 05:45:00: 데이터: {평균=45.075}
- 05:50:00: 데이터: {평균=58.390}
- 05:55:00: 데이터: {평균=57.847}
- 06:00:00: 데이터: {평균=61.123}
관련 정보
Amazon EC2 Auto Scaling을 위한 동적 스케일링
사용 가능한 지표 보기