Amazon CloudWatch에서 경보를 이해하고 경보 전환 상태를 평가하고 싶습니다.
간략한 설명
경보를 생성하면 CloudWatch 경보는 제공된 지표 데이터를 기반으로 지정된 조건을 평가합니다. 경보를 생성할 때 사용하는 다음 속성을 참고하십시오.
- 지표 선택 - 모니터링하려는 지표입니다.
- 임계값 구성 - 경보를 간접 호출하는 특정 값입니다.
- 평가 기간 - 경보 기간의 수입니다. 잘못된 경보를 피하려면 이 파라미터를 사용하십시오.
- DatapointsToAlarm - 경보를 간접 호출하기 위해 위반해야 하는 데이터 포인트의 수입니다. 이를 사용하여 경보의 감도를 설정합니다.
- 기간 - 지표 데이터 집계 간격(예: 60초마다)입니다.
- 통계 - 지표 데이터 집계 유형(예: MIN 또는 AVG)입니다.
- TMD(Treat Missing Data, 누락된 데이터 처리) - 지표 데이터가 누락된 경우 경보를 평가하는 데 사용되는 방법입니다.
CloudWatch가 경보를 평가한 다음 누락된 데이터를 처리하는 방법을 이해하려면 경보 평가 및 CloudWatch 경보가 누락된 데이터를 처리하는 방식 구성을 참조하십시오.
해결 방법
CloudWatch가 검색된 데이터 요소를 분석하는 방법을 검토하려면 CloudWatch에서 경보 기록을 확인하십시오.
- CloudWatch 콘솔을 연 다음 탐색 창에서 Alarms(경보)을 선택합니다.
- 경보를 선택한 다음 History(기록) 탭을 선택합니다. History(기록) 탭의 Date(날짜) 열에서 하이퍼링크로 연결된 타임스탬프 항목은 경보가 ALARM 상태로 전환된 시점을 보여줍니다.
Alarm History(경보 기록)에서 경보 전환 상태를 평가하려면 경보 1과 경보 2에 대한 다음 JSON 예제를 참조하십시오. 두 가지 경보 JSON 예제 모두에 대해 다음 조건을 검토하십시오.
- 지표 - HealthyHostCount
- 임계값 구성 - 1(3분 이내 데이터 포인트 1개 이하)
- 평가 기간 - 데이터 포인트 3개
- 기간 - 1분
- 통계 - 최소값
- TMD(Treat Missing Data, 누락된 데이터 처리) - 예를 들어 경보 1에서 누락된 데이터 처리 옵션이 누락되었습니다. 예를 들어 경보 2에서 누락된 데이터 처리 옵션이 위반되었습니다.
경보 1 JSON 예제:
"newState": {
"stateValue": "ALARM",
"stateReason": "Threshold Crossed: 1 out of the last 3 datapoints [1.0 (28/03/24 17:11:00)] was less than or equal to the threshold (1.0) (minimum 1 datapoint for OK -> ALARM transition).",
"stateReasonData": {
"version": "1.0",
"queryDate": "2024-03-28T17:13:09.156+0000",
"startDate": "2024-03-28T17:09:00.000+0000",
"statistic": "Minimum",
"period": 60,
"recentDatapoints": [
2,
2,
1
],
"threshold": 1,
"evaluatedDatapoints": [
{
"timestamp": "2024-03-28T17:11:00.000+0000",
"sampleCount": 2,
"value": 1
}
이전 JSON의 경우 값이 2, 2, 1인 데이터 포인트 3개가 검색되었습니다. 마지막 3개의 데이터 포인트 중 1개가 임계값 1보다 작거나 같기 때문에 경보가 ALARM 상태로 전환되었습니다.
참고: evaluatedDatapoints 파라미터는 위반 데이터 포인트에 대한 세부 정보를 보여줍니다. 이전 JSON의 경우 CloudWatch에서 샘플 2개를 수신했습니다. 이러한 샘플을 최소 통계로 집계하면 데이터 포인트 1이 반환됩니다. 이 값은 1보다 작거나 같은 임계값을 초과합니다. 따라서 경보는 ALARM 상태로 전환됩니다.
경보 2 JSON 예제:
"newState": {
"stateValue": "ALARM",
"stateReason": "Threshold Crossed: 2 datapoints were received for 3 periods and 1 missing datapoint was treated as [Breaching].",
"stateReasonData": {
"version": "1.0",
"queryDate": "2024-03-28T20:09:52.566+0000",
"startDate": "2024-03-28T20:00:00.000+0000",
"statistic": "Minimum",
"period": 60,
"recentDatapoints": [
2,
2
],
"threshold": 1,
"evaluatedDatapoints": [
{
"timestamp": "2024-03-28T20:07:00.000+0000"
}
이전 JSON의 경우 경보 구성은 세 개의 데이터 포인트를 평가합니다. 2와 2의 값을 갖는 두 개의 데이터 포인트가 검색되었습니다. 세 번째 데이터 포인트 값이 누락되어 경보 평가 시 TMD 옵션이 고려됩니다. TMD는 위반으로 설정되어 있고 누락된 데이터 포인트 값은 위반 값입니다. 이로 인해 경보가 ALARM 상태로 전환됩니다.
관련 정보
Amazon CloudWatch 경보 사용
CloudWatch 경보의 일반적인 기능
모니터링되는 지표에 위반 데이터 포인트가 없는데 CloudWatch 경보가 시작된 이유는 무엇입니까?