내용으로 건너뛰기

SageMaker AI 리소스를 시작할 때 용량 부족 오류를 해결하려면 어떻게 해야 합니까?

2분 분량
0

Amazon SageMaker AI 리소스(훈련 작업, 배치 변환 작업, 처리 작업, 엔드포인트, 노트북 인스턴스 또는 SageMaker Studio 앱) 중 하나를 시작하려고 할 때 발생하는 ‘InsufficientCapacity’ 오류를 해결하고 싶습니다.

해결 방법

AWS에 요청을 완료할 수 있는 온디맨드 용량이 충분하지 않은 경우, 다음 오류 메시지와 비슷한 InsequentCapacity 오류가 발생할 수 있습니다.

"Unable to provision requested ML compute capacity due to InsufficientInstanceCapacity error. Please retry using a different ML instance type or after some time."

"An error occurred (InsufficientInstanceCapacity) when calling the StartInstances operation (reached max retries: 4): Insufficient capacity."

Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스 용량은 고정적이지 않습니다. 인스턴스 용량은 특정 AWS 리전 또는 가용 영역의 워크로드에 따라 달라집니다. 용량 부족 오류는 AWS가 AWS 계정에 적용하는 리소스 할당량과 관련이 없습니다.

용량 문제는 일시적이며 요청을 다시 시도하면 해결될 수 있습니다. 요청을 연기할 수 있는 경우 나중에 요청을 시도하십시오.

인스턴스에 즉시 액세스하려면 다음 작업 중 하나를 수행하십시오.

  • 동일한 패밀리 내에서 더 큰 인스턴스 크기로 전환하거나, 다른 인스턴스 유형으로 전환하거나, 워크로드에 따라 다른 인스턴스 패밀리를 사용하십시오.
  • 각 인스턴스 유형에는 자체 용량이 있으므로 동일한 인스턴스 유형에 대해 다른 리전 또는 가용 영역에서 리소스를 시작하십시오. 각 리전에서 사용할 수 있는 SageMaker AI 인스턴스 유형을 확인하십시오.
    참고: 인스턴스 유형 가용성을 보려면 온디맨드 요금 페이지에서 SageMaker AI 기능 탭을 선택합니다. 그런 다음, 리전 드롭다운 목록에서 해당 리전을 선택합니다.
  • 인스턴스 수를 줄인 새 인스턴스 요청을 제출하십시오.
  • 미션 크리티컬 워크로드에 대한 인스턴스를 예약하려면 온디맨드 용량 예약을 사용하십시오. 용량 예약을 만들려면 AWS 계정 관리자에게 문의하십시오.

SageMaker Studio 앱을 실행하는 경우 여러 가용 영역에 걸쳐 있는 서브넷으로 앱을 구성하여 용량 문제를 최소화하십시오.

노트북 인스턴스 또는 훈련 작업을 시작하는 경우 서로 다른 가용 영역에 여러 서브넷이 있는 동일한 인스턴스 유형을 선택하십시오.

관련 정보

인스턴스 용량 부족

지원되는 리전 및 할당량

AWS 공식업데이트됨 3달 전