호출되지 않는 CloudWatch 경보 문제를 해결하려면 어떻게 해야 합니까?

3분 분량
0

호출되지 않는 Amazon CloudWatch 경보 문제를 해결하려고 합니다.

간략한 설명

CloudWatch 경보는 경보 평가 시 사용할 수 있는 데이터 포인트를 기반으로 지표를 평가합니다. 표준 경보는 1분마다 평가되고 고해상도 경보는 10초마다 평가됩니다. 수집된 데이터 포인트가 지정된 기간의 임계값을 초과하지 않으면 경보는 OK(정상) 상태로 유지됩니다.

참고: 기간은 CloudWatch가 데이터를 분석하여 경보가 호출되는지, 호출되지 않는지 결정하는 시간 간격입니다. Period(기간)Evaluation Periods(평가 기간) 수는 기간을 시간 간격으로 정의합니다.

호출되지 않는 경보의 가능한 원인은 다음과 같습니다.

  • Amazon CloudWatch 경보가 방금 시작되었습니다.
  • 이벤트 기반 지표 및 주기적 지표의 경우 평가 기간 내에 데이터 포인트가 지표로 푸시되지 않으면 경보가 호출되지 않을 수 있습니다.
  • 지표를 사용할 수 없습니다.
  • namespace(네임스페이스), metric name(지표 이름) 또는 dimensions(차원) 등과 같은 지표 파라미터가 잘못 구성되었습니다.
  • 지표에 데이터가 충분하지 않아 경보 상태를 결정할 수 없습니다.

해결 방법

지표 필터 구성 확인

지표 필터를 통해 생성된 지표의 경우 다음을 확인하십시오.

  • CloudWatch Logs 기반 지표 필터를 사용하는 경우 예상 로그가 생성되고 필터가 올바르게 정의되었는지 확인하십시오.
  • 로그 이벤트에 지표 필터 패턴의 예상 값이 포함되어 있는지 확인합니다. 패턴이 예상대로 일치하는지 확인하려면 예제 로그 이벤트에 대해 패턴을 테스트하십시오.
  • 정확한 수학 통계 값이 구성되었는지 확인하려면 경보 구성을 확인합니다.

“M out of N alarm(N개 중 M개의 경보)” 설정 사용

참고: 다음 해상도에서 M은 경보를 호출하는 데 필요한 임계값보다 높은 연속 데이터 포인트를 나타냅니다. N은 평가 기간 내의 총 데이터 포인트를 나타냅니다.

CloudWatch 지표에 계속 유입되는 데이터 포인트 때문에 이후의 각 경보 평가에는 집계된 서로 다른 데이터 포인트가 사용될 수 있습니다. 나중에 이벤트 기록을 검토하면 전체 데이터 포인트 집합이 나타납니다. CloudWatch 경보는 평가 시 사용 가능한 데이터 포인트를 사용하여 지표를 평가합니다. 그러나 경보 평가 후에 새 데이터 포인트가 게시될 수 있습니다. 이러한 새 데이터 포인트는 지표 데이터에 영향을 줄 수 있습니다. 이 문제를 해결하려면 CloudWatch 경보가 더 많은 데이터 포인트를 평가할 수 있도록 “M out of N alarm(N개 중 M개의 경보)”을 구성하십시오.

예제 시나리오:

CPUUtilization에 대한 N개 중 M개의 경보가 M은 2, N은 3, 기간은 5분으로 구성되었습니다. N이 3이므로 평가 기간은 15분입니다. M은 2이므로 CPUUtilization이 마지막 3개의 5분 기간 중 2개 기간에서 임계값을 초과하면 경보가 호출됩니다.

  • 10분에 CPUUtilization이 85%인 경우 경보는 임계값인 90% 미만입니다.
  • 15분에 CPUUtilization이 92%인 경우 경보는 임계값인 90%보다 높습니다.
  • 20분에 CPUUtilization이 94%인 경우 경보는 임계값보다 높습니다. 경보가 호출되는 이유는 마지막 3개의 5분 기간 중 2개에 대해 임계값을 초과해야 한다는 요구 사항이 충족되기 때문입니다.

N개 중 M개의 경보 설정을 구성하려면 다음 단계를 완료하십시오.

  1. CloudWatch 콘솔을 엽니다.
  2. 탐색 창에서 **Alarms(경보)**를 선택한 다음, **All alarms(모든 경보)**를 선택합니다.
  3. N개 중 M개에 대해 구성하려는 경보를 찾아 선택합니다.
  4. 작업 드롭다운 메뉴를 선택하고 **Edit(편집)**를 선택합니다.
  5. **Additional configuration(추가 구성)**을 선택합니다. 지정된 첫 번째 값이 두 번째 값보다 작아야 합니다. 이 구성은 경보를 호출하는 데 필요한 임계값보다 높은 연속 데이터 포인트의 수를 결정합니다.

관련 정보

지표에 위반 데이터 포인트가 없는데 CloudWatch 경보가 시작된 이유는 무엇입니까?

집계

AWS 공식
AWS 공식업데이트됨 10달 전