호출되지 않는 Amazon CloudWatch 경보 문제를 해결하려고 합니다.
간략한 설명
CloudWatch 경보는 경보 평가 시 사용할 수 있는 데이터 포인트를 기반으로 지표를 평가합니다. 표준 경보는 1분마다 평가되고 고해상도 경보는 10초마다 평가됩니다. 수집된 데이터 포인트가 지정된 기간의 임계값을 초과하지 않으면 경보는 OK(정상) 상태로 유지됩니다.
참고: 기간은 CloudWatch가 데이터를 분석하여 경보가 호출되는지, 호출되지 않는지 결정하는 시간 간격입니다. Period(기간) 및 Evaluation Periods(평가 기간) 수는 기간을 시간 간격으로 정의합니다.
호출되지 않는 경보의 가능한 원인은 다음과 같습니다.
- Amazon CloudWatch 경보가 방금 시작되었습니다.
- 이벤트 기반 지표 및 주기적 지표의 경우 평가 기간 내에 데이터 포인트가 지표로 푸시되지 않으면 경보가 호출되지 않을 수 있습니다.
- 지표를 사용할 수 없습니다.
- namespace(네임스페이스), metric name(지표 이름) 또는 dimensions(차원) 등과 같은 지표 파라미터가 잘못 구성되었습니다.
- 지표에 데이터가 충분하지 않아 경보 상태를 결정할 수 없습니다.
해결 방법
지표 필터 구성 확인
지표 필터를 통해 생성된 지표의 경우 다음을 확인하십시오.
- CloudWatch Logs 기반 지표 필터를 사용하는 경우 예상 로그가 생성되고 필터가 올바르게 정의되었는지 확인하십시오.
- 로그 이벤트에 지표 필터 패턴의 예상 값이 포함되어 있는지 확인합니다. 패턴이 예상대로 일치하는지 확인하려면 예제 로그 이벤트에 대해 패턴을 테스트하십시오.
- 정확한 수학 통계 값이 구성되었는지 확인하려면 경보 구성을 확인합니다.
“M out of N alarm(N개 중 M개의 경보)” 설정 사용
참고: 다음 해상도에서 M은 경보를 호출하는 데 필요한 임계값보다 높은 연속 데이터 포인트를 나타냅니다. N은 평가 기간 내의 총 데이터 포인트를 나타냅니다.
CloudWatch 지표에 계속 유입되는 데이터 포인트 때문에 이후의 각 경보 평가에는 집계된 서로 다른 데이터 포인트가 사용될 수 있습니다. 나중에 이벤트 기록을 검토하면 전체 데이터 포인트 집합이 나타납니다. CloudWatch 경보는 평가 시 사용 가능한 데이터 포인트를 사용하여 지표를 평가합니다. 그러나 경보 평가 후에 새 데이터 포인트가 게시될 수 있습니다. 이러한 새 데이터 포인트는 지표 데이터에 영향을 줄 수 있습니다. 이 문제를 해결하려면 CloudWatch 경보가 더 많은 데이터 포인트를 평가할 수 있도록 “M out of N alarm(N개 중 M개의 경보)”을 구성하십시오.
예제 시나리오:
CPUUtilization에 대한 N개 중 M개의 경보가 M은 2, N은 3, 기간은 5분으로 구성되었습니다. N이 3이므로 평가 기간은 15분입니다. M은 2이므로 CPUUtilization이 마지막 3개의 5분 기간 중 2개 기간에서 임계값을 초과하면 경보가 호출됩니다.
- 10분에 CPUUtilization이 85%인 경우 경보는 임계값인 90% 미만입니다.
- 15분에 CPUUtilization이 92%인 경우 경보는 임계값인 90%보다 높습니다.
- 20분에 CPUUtilization이 94%인 경우 경보는 임계값보다 높습니다. 경보가 호출되는 이유는 마지막 3개의 5분 기간 중 2개에 대해 임계값을 초과해야 한다는 요구 사항이 충족되기 때문입니다.
N개 중 M개의 경보 설정을 구성하려면 다음 단계를 완료하십시오.
- CloudWatch 콘솔을 엽니다.
- 탐색 창에서 **Alarms(경보)**를 선택한 다음, **All alarms(모든 경보)**를 선택합니다.
- N개 중 M개에 대해 구성하려는 경보를 찾아 선택합니다.
- 작업 드롭다운 메뉴를 선택하고 **Edit(편집)**를 선택합니다.
- **Additional configuration(추가 구성)**을 선택합니다. 지정된 첫 번째 값이 두 번째 값보다 작아야 합니다. 이 구성은 경보를 호출하는 데 필요한 임계값보다 높은 연속 데이터 포인트의 수를 결정합니다.
관련 정보
지표에 위반 데이터 포인트가 없는데 CloudWatch 경보가 시작된 이유는 무엇입니까?
집계