Como soluciono problemas do meu alarme do CloudWatch no estado INSUFFICIENT_DATA?

4 minuto de leitura
0

Quero solucionar meu alarme do Amazon CloudWatch no estado INSUFFICIENT_DATA.

Breve descrição

Quando você cria um alarme do CloudWatch, seu primeiro estado é INSUFFICIENT_DATA. Ele permanece nesse estado até que a primeira avaliação da métrica monitorada seja concluída. Normalmente, um alarme sai do estado INSUFFICIENT_DATA alguns minutos após a criação. Esse é o comportamento normal de uma métrica.

Essas são as possíveis causas que mantêm seu alarme do CloudWatch no estado INSUFFICIENT_DATA:

  • A métrica tem pontos de dados ausentes.
  • Os parâmetros de métrica estão configurados incorretamente.
  • Os períodos de alarme estão configurados incorretamente.
  • Atraso na entrega de pontos de dados devido à falta de conectividade

Resolução

Para solucionar o problema do alarme do CloudWatch no estado INSUFFICIENT_DATA, verifique as seguintes causas possíveis:

A métrica tem pontos de dados ausentes

Quando você tem uma métrica que monitora eventos como mudanças na infraestrutura, falhas na rede e interrupções no serviço, a métrica não relata pontos de dados regularmente. Se um alarme não tiver pontos de dados métricos em um período de tempo especificado, os pontos de dados estarão ausentes e o estado do alarme será INSUFFICIENT_DATA.

Para resolver um estado INSUFFICIENT_DATA causado pela falta de pontos de dados, certifique-se de configurar como o alarme trata os pontos de dados ausentes. Use o parâmetro notBreaching para tratar os pontos de dados ausentes como bons e dentro do limite ou o parâmetro ignore para manter o estado de alarme atual. Para obter mais informações, consulte Configurando como os alarmes do CloudWatch tratam os dados ausentes.

Os parâmetros de métrica estão configurados incorretamente

Cada métrica é definida por um namespace, um nome de métrica e até 30 dimensões. Quando um ponto de dados é recuperado, um carimbo de data/hora deve ser especificado e, opcionalmente, uma unit. Se você fornecer um valor incorreto para um desses parâmetros, o CloudWatch tenta recuperar uma métrica que não existe. Isso resulta em um conjunto de dados vazio.

Observação: os pontos de dados geralmente são enviados para uma métrica com uma única unidade. Você não precisa especificar a unidade ao criar um alarme. Além disso, você não encontrará problemas de configuração se não especificar uma unidade. É uma prática recomendada usar a unidade correta quando você tem várias unidades para seus pontos de dados métricos.

Para resolver um estado de INSUFFICIENT_DATA causado por parâmetros configurados incorretamente, conclua as seguintes etapas:

  1. Execute ao comando da API DescribeAlarms para obter uma lista completa de parâmetros para suas métricas monitoradas.
  2. Execute o comando da API ListMetrics. Compare a saída do ListMetrics com a lista de parâmetros para suas métricas monitoradas.
  3. Verifique os parâmetros métricos em busca de erros ortográficos, uso inadequado de letras minúsculas e maiúsculas e dimensões incorretas ou ausentes.

Os períodos de alarme estão configurados incorretamente

Um alarme pode ser configurado para recuperar pontos de dados na frequência necessária. No entanto, se você usar um período menor do que o período usado pelo serviço ou pela fonte, poderá obter estados de alarme indesejados. Para resolver isso, configure o período do alarme para ser maior ou igual ao período em que os pontos de dados métricos são enviados. Além disso, você pode configurar seu alarme para usar configurações M de N. Para mais informações, consulte Avaliação de um alarme.

Atraso na entrega de pontos de dados devido à falta de conectividade

Se você tiver uma configuração de alarme padrão, o alarme avaliará sua métrica a cada minuto. Quando a métrica é avaliada, o alarme recupera os pontos de dados disponíveis da métrica configurada. Se você não tiver conectividade quando seu alarme avalia a métrica, o alarme não poderá recuperar pontos de dados nem entregá-los ao CloudWatch. Isso invoca o estado INSUFFICIENT_DATA.

Depois que a conectividade é restaurada, o backlog de pontos de dados com carimbos de data/hora incluídos é enviado para o CloudWatch. Quando os pontos de dados são enviados após o atraso, o alarme recupera pontos de dados recentes com base no período e no período de avaliação especificados. Além disso, os espaços em branco na métrica não estão mais em branco e os pontos de dados são armazenados no CloudWatch. No entanto, o alarme já avaliou esse período de tempo e o histórico do alarme ainda indica um estado INSUFFICIENT_DATA e uma mensagem de erro semelhante à seguinte:

"stateValue": "INSUFFICIENT_DATA",
   "stateReason": "Insufficient Data: 2 datapoints were unknown."

Para resolver um estado INSUFFICIENT_DATA causado por um atraso na entrega de pontos de dados, configure como seu alarme do CloudWatch trata os dados ausentes.

AWS OFICIAL
AWS OFICIALAtualizada há um ano