Amazon CloudWatch グラフでアラームメトリックスが設定されたしきい値を超えていることがわかっても、CloudWatch アラームはアクティブになっていません。CloudWatch アラームがアクティブになっていることを確認し、アラームアクションを実行したいと考えています。
簡単な説明
CloudWatch アラームは、時間集計されたメトリクスをローリングウィンドウで継続的に監視します。評価期間中に収集されたすべてのデータポイントが設定されたしきい値を超えない場合、CloudWatch アラームはアクティブになりません。
CloudWatch アラームは、アラームの状態が変化したときにアクションを開始し、指定された期間中維持されます。詳細については、「Amazon CloudWatch アラームの使用」を参照してください。
**重要:**アラームが指定された状態にある場合、CloudWatch アラームは Amazon EC2 Auto Scaling アクションを継続的にアクティブにします。状態が変化せず、アラームが指定された状態のままであれば、アクティビティは続行されます。
解決策
アラームを作成するときに時間集計されたメトリクスを測定するには、CloudWatch が使用するメカニズムを確認してください。
アラームが正しく機能することを確認するには、メトリックスデータのしきい値を下げてください。
トラブルシューティングの例
次の例では、アラームが平均 CPU 使用率を監視しています。アラームは、しきい値が 45 を超え、間隔が 5 分に設定されています。評価期間と警告するデータポイントは両方とも 3 です。直近の 3 つの連続期間の既存のデータポイントがすべてしきい値を上回ると、アラームは ALARM 状態に変わります。アラームは 5 分間 3 回連続して鳴ります。
時間集計されたメトリクスの評価間隔は 15 分です。
- 05:25:00: データ: {平均=61.123}
- 05:30:00: データ: {平均=57.847}
- 05:35:00: データ: {平均=60.503}
- 05:40:00: データ: {平均=55.473}
- 05:45:00: データ: {平均=41.685}
- 05:50:00: データ: {平均=58.390}
- 05:55:00: データ: {平均=57.846}
- 06:00:00: データ: {平均=61.123}
詳細については、「アラームの評価」を参照してください。
前述のデータポイントにより、次のようなアラーム状態になります。
- 05:35 アラーム
- 05:40 アラーム
- 05:45 アラームで OK
- 05:50 OK
- 05:55 OK
- 06:00 アラームで OK
05:55 で収集されたデータポイントは、CPU 使用率の平均しきい値である 45% を超えています。ただし、アラームは OK 状態のままで、05:55 になってもアクションはアクティブになりません。05:45:00 に収集されたデータポイントはしきい値を超えず、05:55 での評価に含まれるため、アクションは発生しません。5 分後、06:00 にアラーム状態が OK から ALARM に変わるため、アラームがアクションを開始します。
以下の時間集計されたメトリクスでは、データポイントが平均 CPU 使用率のしきい値である 45% を超えているため、アラーム状態は 05:25:00 以降に ALARM に変わります。状態は変化しないため、アラームアクションはアクティブになりません。
- 05:25:00: データ: {平均=61.123}
- 05:30:00: データ: {平均=57.847}
- 05:35:00: データ: {平均=60.503}
- 05:40:00: データ: {平均=55.473}
- 05:45:00: データ: {平均=45.075}
- 05:50:00: データ: {平均=58.390}
- 05:55:00: データ: {平均=57.847}
- 06:00:00: データ: {平均=61.123}
関連情報
Amazon EC2 Auto Scaling のダイナミックスケーリング
利用可能なメトリクスを表示する