Amazon ECS 배포 회로 차단기가 배포 상태를 FAILED로 설정한 이유는 무엇입니까?

3분 분량
0

Amazon Elastic Container Service(Amazon ECS) 배포 회로 차단기가 배포 상태를 FAILED로 설정했습니다. 배포 실패의 원인을 해결하고 싶습니다.

간략한 설명

배포의 연속 실패 횟수가 정의된 임계값에 도달하면 배포 회로 차단기가 배포 상태를 FAILED로 설정합니다. 다음과 같은 오류 메시지가 표시될 수 있습니다.

"Resource handler returned message: "Error occurred during operation 'ECS Deployment Circuit Breaker was triggered'." (RequestToken: xxxxxxxx-xxxx-xxxxxx-xxxxxxx, HandlerErrorCode: GeneralServiceException)"

다음과 같은 문제로 인해 배포가 실패할 수 있습니다.

  • 컨테이너가 상태 확인에 실패했습니다.
  • 대상 그룹이 Application Load Balancer 상태 확인에 실패했습니다.
  • Amazon Elastic Container Registry(Amazon ECR) 이미지가 존재하지 않습니다.
  • 컨테이너 인스턴스가 모든 요구 사항을 충족하지 못했습니다.
  • 작업이 중지되었거나 시작하는 데 실패했습니다.

해결 방법

이 문제를 해결하려면 Amazon ECS 서비스 이벤트 메시지를 확인하여 Amazon ECS에서 회로 차단기를 활성화한 이유를 파악합니다. 그런 다음, 이유에 따라 다음과 같은 문제 해결 조치를 수행합니다.

컨테이너가 상태 확인에 실패함

작업의 Amazon ECS 컨테이너가 상태 확인을 통과할 수 없는 경우 다음 오류 메시지가 표시됩니다.

"(service AWS-Service) (task ff3e71a4-d7e5-428b-9232-2345657889) failed container health checks."

이 문제를 해결하려면 다음 작업을 수행하십시오.

자세한 내용은 Amazon ECS 작업의 컨테이너 상태 확인 실패 문제를 해결하려면 어떻게 해야 합니까?를 참조하십시오.

대상 그룹이 Application Load Balancer 상태 확인에 실패함

이 문제를 해결하려면 다음 단계를 완료하십시오.

  1. 대상 그룹의 상태 확인 설정을 올바르게 구성했는지 확인합니다.
  2. 애플리케이션이 지정된 상태 확인 요청에 올바르게 응답하는지 확인합니다. 또한 상태 확인 요청을 차단하는 네트워크 또는 보안 그룹 문제가 없는지 확인합니다.

자세한 내용은 Application Load Balancer의 상태 확인 실패 문제를 해결하려면 어떻게 해야 하나요?를 참조하십시오.

참고: Amazon ECS는 상태 확인 실패가 연속되는 경우에만 롤백을 시작합니다.

Amazon ECR 이미지가 존재하지 않음

이 문제를 해결하려면 다음 단계를 완료하십시오.

  1. 작업 정의의 이미지 URI가 정확하고 Amazon ECR 리포지토리 또는 기타 컨테이너 레지스트리에 있는지 확인합니다.
  2. Amazon ECS 작업 실행 IAM 역할에 Amazon ECR에서 이미지를 가져올 수 있는 올바른 권한이 있는지 확인합니다.
  3. Amazon ECS 클러스터와 컨테이너 레지스트리 간의 네트워크 연결 문제를 확인합니다.

자세한 내용은 Amazon ECS 클러스터에서 작업을 시작하지 못할 때 "Image does not exist" 오류를 해결하려면 어떻게 해야 합니까?를 참조하십시오.

컨테이너 인스턴스가 모든 요구 사항을 충족하지 못함

이 문제를 해결하려면 Amazon ECS에서 “no container instance met all of its requirements” 오류를 해결하려면 어떻게 해야 합니까?를 참조하십시오.

작업이 중지되었거나 시작하는 데 실패함

이 문제를 해결하려면 다음 단계를 완료하십시오.

  1. Amazon CloudWatch Logs Insights를 사용하여 로그를 검토하고 DescribeTasks API를 사용하여 작업의 stoppedReason를 가져옵니다.
  2. 클러스터에 활성 인스턴스가 있는지 확인합니다.
  3. 작업의 CPU 또는 메모리가 컨테이너 인스턴스의 CPU 또는 메모리를 초과하지 않는지 확인합니다.

자세한 내용은 Amazon ECS 작업이 중지되는 이유는 무엇입니까?Amazon ECS 클러스터에서 작업이 시작되지 않는 이유는 무엇입니까?를 참조하십시오.

관련 정보

Amazon ECS 배포 회로 차단기 발표

AWS 공식
AWS 공식업데이트됨 2달 전