如何確定 CloudWatch 警示是否啟動動作?

1 分的閱讀內容
0

仍未啟動我的 CloudWatch 警示,即使我可以在 Amazon CloudWatch 圖表中看到警示指標超過設定的臨界值。我想要確保我的 CloudWatch 警示是否已啟動並執行警示動作。

簡短描述

CloudWatch 警示會在移動視窗中持續觀看時間彙總指標。如果評估期間收集的所有資料點均未超過設定的臨界值,則不會啟動 CloudWatch 警示。

CloudWatch 警示會在警示狀態變更時啟動動作,並維護指定的期間數。如需詳細資訊,請參閱使用 Amazon CloudWatch 警示

**重要事項:**如果警示處於指定狀態,則 CloudWatch 警示會持續啟動 Amazon EC2 Auto Scaling 動作。如果沒有任何狀態變更,並且警示保持在指定的狀態,則將會繼續進行活動。

解決方法

若要在建立警示時測量時間彙總指標,請驗證 CloudWatch 使用的機制。

若要確保警示是否正常運作,請降低指標資料臨界值。

疑難排解範例

在下列範例中,警示會觀看平均 CPU 使用率。警示設定的臨界值大於 45,每段時間為 5 分鐘。評估期間警示的資料點都是 3。如果最近連續三段時間的所有現有資料點都高於臨界值,則警示會變更為 ALARM 狀態。警示會連續執行三段時間,每段時間為 5 分鐘。

時間彙總指標的評估間隔為 15 分鐘:

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=41.685}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.846}
  • 06:00:00: data: {Avg=61.123}

如需詳細資訊,請參閱評估警示

前述資料點會導致下列警示狀態:

  • 05:35 ALARM
  • 05:40 ALARM
  • 05:45 ALARM to OK
  • 05:50 OK
  • 05:55 OK
  • 06:00 OK to ALARM

在 05:55 收集的資料點超過平均 CPU 使用率 45% 的臨界值。不過,警示會維持在 OK 狀態,並且不會在 05:55 啟動動作。因為在 05:45:00 收集的資料點沒有超過臨界值,並且已包含在 05:55 的評估中,因此不會發生任何動作。5 分鐘後警示會啟動動作,因為警示狀態會在 06:00 從 OK 變更為 ALARM

對於下列時間彙總指標,資料點超過平均 CPU 使用率 45% 的臨界值,因此警示狀態會在 05:25:00 之後變更為 ALARM。因為沒有狀態變更,因此不會啟動警示動作。

  • 05:25:00: data: {Avg=61.123}
  • 05:30:00: data: {Avg=57.847}
  • 05:35:00: data: {Avg=60.503}
  • 05:40:00: data: {Avg=55.473}
  • 05:45:00: data: {Avg=45.075}
  • 05:50:00: data: {Avg=58.390}
  • 05:55:00: data: {Avg=57.847}
  • 06:00:00: data: {Avg=61.123}

相關資訊

Amazon EC2 Auto Scaling 的動態擴展

檢視可用的指標

AWS 官方
AWS 官方已更新 10 個月前