仍未啟動我的 CloudWatch 警示,即使我可以在 Amazon CloudWatch 圖表中看到警示指標超過設定的臨界值。我想要確保我的 CloudWatch 警示是否已啟動並執行警示動作。
簡短描述
CloudWatch 警示會在移動視窗中持續觀看時間彙總指標。如果評估期間收集的所有資料點均未超過設定的臨界值,則不會啟動 CloudWatch 警示。
CloudWatch 警示會在警示狀態變更時啟動動作,並維護指定的期間數。如需詳細資訊,請參閱使用 Amazon CloudWatch 警示。
**重要事項:**如果警示處於指定狀態,則 CloudWatch 警示會持續啟動 Amazon EC2 Auto Scaling 動作。如果沒有任何狀態變更,並且警示保持在指定的狀態,則將會繼續進行活動。
解決方法
若要在建立警示時測量時間彙總指標,請驗證 CloudWatch 使用的機制。
若要確保警示是否正常運作,請降低指標資料臨界值。
疑難排解範例
在下列範例中,警示會觀看平均 CPU 使用率。警示設定的臨界值大於 45,每段時間為 5 分鐘。評估期間和警示的資料點都是 3。如果最近連續三段時間的所有現有資料點都高於臨界值,則警示會變更為 ALARM 狀態。警示會連續執行三段時間,每段時間為 5 分鐘。
時間彙總指標的評估間隔為 15 分鐘:
- 05:25:00: data: {Avg=61.123}
- 05:30:00: data: {Avg=57.847}
- 05:35:00: data: {Avg=60.503}
- 05:40:00: data: {Avg=55.473}
- 05:45:00: data: {Avg=41.685}
- 05:50:00: data: {Avg=58.390}
- 05:55:00: data: {Avg=57.846}
- 06:00:00: data: {Avg=61.123}
如需詳細資訊,請參閱評估警示。
前述資料點會導致下列警示狀態:
- 05:35 ALARM
- 05:40 ALARM
- 05:45 ALARM to OK
- 05:50 OK
- 05:55 OK
- 06:00 OK to ALARM
在 05:55 收集的資料點超過平均 CPU 使用率 45% 的臨界值。不過,警示會維持在 OK 狀態,並且不會在 05:55 啟動動作。因為在 05:45:00 收集的資料點沒有超過臨界值,並且已包含在 05:55 的評估中,因此不會發生任何動作。5 分鐘後警示會啟動動作,因為警示狀態會在 06:00 從 OK 變更為 ALARM。
對於下列時間彙總指標,資料點超過平均 CPU 使用率 45% 的臨界值,因此警示狀態會在 05:25:00 之後變更為 ALARM。因為沒有狀態變更,因此不會啟動警示動作。
- 05:25:00: data: {Avg=61.123}
- 05:30:00: data: {Avg=57.847}
- 05:35:00: data: {Avg=60.503}
- 05:40:00: data: {Avg=55.473}
- 05:45:00: data: {Avg=45.075}
- 05:50:00: data: {Avg=58.390}
- 05:55:00: data: {Avg=57.847}
- 06:00:00: data: {Avg=61.123}
相關資訊
Amazon EC2 Auto Scaling 的動態擴展
檢視可用的指標