Como soluciono erros de capacidade insuficiente ao iniciar meus recursos de IA do SageMaker?

3 minuto de leitura
0

Recebo um erro “InsufficientCapacity” quando tento iniciar uma tarefa de treinamento do Amazon SageMaker IA, um trabalho de transformação em lote, um endpoint, uma instância de notebook ou uma aplicação do SageMaker Studio.

Resolução

Quando a AWS não tem capacidade sob demanda suficiente para concluir sua solicitação, você pode receber um erro de InsufficientCapacity semelhante às seguintes mensagens de erro:

“Unable to provision requested ML compute capacity due to InsufficientInstanceCapacity error. Please retry using a different ML instance type or after some time.”

“An error occurred (InsufficientInstanceCapacity) when calling the StartInstances operation (reached max retries: 4): Insufficient capacity.”

A capacidade da instância do Amazon Elastic Compute Cloud (Amazon EC2) não é estática. A capacidade da instância depende de workloads em uma região ou zona de disponibilidade específica da AWS. Erros de capacidade insuficiente não estão relacionados às cotas de recursos que a AWS aplica à sua conta da AWS.

Os problemas de capacidade são transitórios e podem ser resolvidos quando você tentar fazer sua solicitação novamente. Se você puder atrasar sua solicitação, tente fazer sua solicitação mais tarde.

Para obter acesso imediato a uma instância, execute uma das seguintes ações:

  • Mude para uma instância maior na mesma família, um tipo de instância diferente ou use uma família de instâncias diferente com base no seu workload.
  • Inicie o recurso em uma região ou zona de disponibilidade diferente para o mesmo tipo de instância, pois cada tipo de instância tem sua própria capacidade. Verifique quais tipos de instância do SageMaker estão disponíveis em cada região. 
    Observação: para ver a disponibilidade do tipo de instância, na página de preços sob demanda, escolha a guia para seu recurso do SageMaker e selecione sua região na lista suspensa Região.
  • Envie uma nova solicitação de instância com um número reduzido de instâncias.
  • Envie uma nova solicitação, mas não especifique uma zona de disponibilidade.
  • Para reservar instâncias para seus workloads essenciais, use a reserva de capacidade sob demanda. Para criar uma reserva de capacidade, consulte Criar uma reserva de capacidade.

Se você iniciar a aplicação SageMaker Studio, é uma prática recomendada configurar a aplicação com sub-redes que abrangem várias zonas de disponibilidade para minimizar os problemas de capacidade.

Se você iniciar uma instância do Notebook ou uma tarefa de treinamento, selecione o mesmo tipo de instância com várias sub-redes em diferentes zonas de disponibilidade.

Informações relacionadas

Capacidade insuficiente da instância

Regiões e cotas suportadas

AWS OFICIAL
AWS OFICIALAtualizada há 2 meses