O disjuntor de implantação do Amazon Elastic Container Service (Amazon ECS) definiu meu estado de implantação como FALHA. Quero solucionar o que causou a falha na implantação.
Breve descrição
Quando o número de falhas consecutivas em uma implantação atinge o limite definido, o disjuntor de implantação define o estado de implantação como FALHA. É possível receber a seguinte mensagem de erro:
“Resource handler returned message: “Error occurred during operation ‘ECS Deployment Circuit Breaker was triggered’.” (RequestToken: xxxxxxxx-xxxx-xxxxxx-xxxxxxx, HandlerErrorCode: GeneralServiceException)”
Os problemas a seguir podem fazer com que sua implantação falhe:
- Um contêiner falhou na verificação de integridade.
- Um grupo de destino falhou nas verificações de integridade do Application Load Balancer.
- A imagem do Amazon Elastic Container Registry (Amazon ECR) não existe.
- As instâncias de contêiner não atenderam a todos os requisitos.
- Uma tarefa foi interrompida ou falhou ao iniciar.
Resolução
Para solucionar esse problema, verifique as mensagens de eventos do serviço do Amazon ECS para identificar por que o Amazon ECS ativou o disjuntor. Em seguida, execute as seguintes ações de solução de problemas com base no motivo.
Um contêiner falhou na verificação de integridade
Se os contêineres do Amazon ECS em sua tarefa não conseguirem passar nas verificações de integridade, você receberá a seguinte mensagem de erro:
”(service AWS-Service) (task ff3e71a4-d7e5-428b-9232-2345657889) failed container health checks.”
Para resolver esse problema, execute as seguintes ações:
Para mais informações, consulte Como soluciono falhas de verificação de integridade de contêineres em tarefas do Amazon ECS?
Um grupo de destino falhou nas verificações de integridade do Application Load Balancer
Para solucionar esse problema, conclua as etapas a seguir:
- Verifique se você definiu corretamente as configurações de verificação de integridade do seu grupo de destino.
- Certifique-se de que sua aplicação responda corretamente à solicitação de verificação de integridade especificada. Além disso, certifique-se de que nenhum problema de rede ou grupo de segurança bloqueie as solicitações de verificação de integridade.
Para mais informações, consulte Como soluciono problemas de falhas nas verificações de integridade dos Application Load Balancers?
Observação: o Amazon ECS inicia uma reversão somente quando as falhas na verificação de integridade são consecutivas.
A imagem do Amazon ECR não existe
Para solucionar esse problema, conclua as etapas a seguir:
- Verifique se o URI da imagem na definição da tarefa está correto e existe em seu repositório do Amazon ECR ou em outro registro de contêiner.
- Certifique-se de que o perfil do IAM de execução de tarefas do Amazon ECS tenha as permissões corretas para extrair imagens do Amazon ECR.
- Verifique se há problemas de conectividade de rede entre seu cluster do Amazon ECS e o registro de contêiner.
Para mais informações, consulte Como resolvo o erro “Image does not exist” quando minhas tarefas não iniciam no meu cluster do Amazon ECS?
As instâncias de contêiner não atenderam a todos os requisitos
Para resolver esse problema, consulte Como resolvo o erro “no container instance met all of its requirements” no Amazon ECS?
Uma tarefa foi interrompida ou falhou ao iniciar
Para solucionar esse problema, conclua as etapas a seguir:
- Use o Amazon CloudWatch Logs Insights para revisar seus logs e a API DescribeTasks para obter o stoppedReason da tarefa.
- Confirme se o cluster tem instâncias ativas.
- Certifique-se de que a CPU ou a memória da tarefa não excedam a CPU ou a memória da instância do contêiner.
Para mais informações, consulte Por que minha tarefa do Amazon ECS foi interrompida? e Por que as tarefas no meu cluster do Amazon ECS não são iniciadas?
Informações relacionadas
Introdução: disjuntor de implantação do Amazon ECS