¿Cómo puedo asegurarme de que las alarmas de CloudWatch activan las acciones?

3 minutos de lectura
0

Mi alarma de Amazon CloudWatch no está activada, aunque puedo ver en mis gráficos de CloudWatch que la métrica de alarma supera el umbral configurado. ¿Cómo puedo asegurarme de que mis alarmas de CloudWatch están activadas y se han realizado las acciones de alarma?

Descripción corta

Las alarmas de CloudWatch que miden las métricas agregadas en el tiempo (como los promedios de cinco minutos) realizan esta medición de forma continua en un período continuo. Si todos los puntos de datos recopilados durante el período de evaluación no superan el umbral configurado, la alarma de CloudWatch no se activa.

Las alarmas de CloudWatch inician acciones cuando el estado de alarma cambia y se mantienen durante un número específico de períodos. Para obtener más información, consulte Creating CloudWatch alarms (Creación de alarmas de CloudWatch).

Importante: Hay una excepción a este comportamiento en el caso de las alarmas de CloudWatch asociadas a las acciones de Amazon EC2 Auto Scaling. Una alarma de CloudWatch sigue activando las acciones de escalado automático cuando la alarma se encuentra en un estado específico. Esto ocurre incluso si no hay cambios de estado y la alarma permanece en ese estado.

Resolución

Asegúrese de tener en cuenta el mecanismo que utiliza CloudWatch para medir las métricas agregadas en el tiempo al crear alarmas.

Considere la posibilidad de reducir los umbrales de datos métricos para asegurarse de que la alarma funcione según lo esperado.

Ejemplo de solución de problemas

En este ejemplo, hay una alarma basada en el uso promedio de la CPU. La alarma está configurada con un umbral de > 45. Se ejecuta durante al menos tres períodos consecutivos de cinco minutos. El período de evaluación es de tres y un período de 300 segundos para las siguientes métricas agregadas por tiempo:

  • 05:25:00: datos: {Promedio=61,123}
  • 05:30:00: datos: {Promedio=57,847}
  • 05:35:00: datos: {Promedio=60,503}
  • 05:40:00: datos: {Promedio=55,473}
  • 05:45:00: datos: {Promedio=41,685}
  • 05:50:00: datos: {Promedio=58,390}
  • 05:55:00: datos: {Promedio=57,846}
  • 06:00:00: datos: {Promedio=61,123}

Estos puntos de datos dan como resultado los siguientes estados de alarma:

  • 05:35 ALARM (ALARMA)
  • 05:40 ALARM
  • 05:45 ALARM to OK (ALARMA A OK)
  • 05:50 OK
  • 05:55 OK
  • 06:00 OK to ALARM (OK a ALARMA)

El punto de datos recopilados a las 05:55 supera el umbral de utilización promedio de la CPU del 45 %. Sin embargo, la alarma permanece en el estado correcto y no activa la acción a las 05:55. Esto ocurre porque el punto de datos recopilado a las 05:45:00, que no supera el umbral, se incluye en la evaluación a las 05:55. Sin embargo, cinco minutos después, la alarma inicia la acción porque el estado de alarma cambia de OK a ALARM a las 06:00.

Para las siguientes métricas agregadas en el tiempo, el estado de alarma es ALARM después de las 05:35 porque todos los puntos de datos superan el umbral de utilización promedio de la CPU del 45 %. Como no hay cambios de estado, la acción de alarma no se activa.

  • 05:25:00: datos: {Promedio=61,123}
  • 05:30:00: datos: {Promedio=57,847}
  • 05:35:00: datos: {Promedio=60,503}
  • 05:40:00: datos: {Promedio=55,473}
  • 05:45:00: datos: {Promedio=45,075}
  • 05:50:00: datos: {Promedio=58,390}
  • 05:55:00: datos: {Promedio=57.847}
  • 06:00:00: datos: {Promedio=61,123}

Información relacionada

Dynamic scaling for Amazon EC2 Auto Scaling (Escalado dinámico para Amazon EC2 Auto Scaling)

Viewing available metrics (Visualización de las métricas disponibles)

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace 2 años