Como faço para solucionar problemas ao trazer meu contêiner personalizado para o Amazon SageMaker Studio?

2 minuto de leitura
0

Quero solucionar problemas durante a criação de um Amazon SageMaker Studio personalizado.

Resolução

Uma imagem do SageMaker é um arquivo que identifica kernels, pacotes de idiomas e outras dependências necessárias para executar um caderno Jupyter no SageMaker Studio. Essas imagens são usadas para criar um ambiente no qual é possível executar seus cadernos Jupyter. Se as imagens incorporadas fornecidas pelo SageMaker não oferecerem suporte ao seu caso de uso, você poderá usar uma imagem personalizada no SageMaker Studio.

Talvez você receba erros ao usar sua imagem de cliente no SageMaker Studio. Esses erros podem resultar principalmente de uma configuração incorreta definida durante o processo de criação da imagem do contêiner. Portanto, certifique-se de que a imagem personalizada seja compatível com o SageMaker Studio.

Para fazer isso, verifique o seguinte ao criar o Dockerfile:

  • Os valores DefaultUID e DefaultGID foram definidos com precisão. O SageMaker Studio só oferece suporte a uma combinação específica de DefaultUID e DefaultGID. Certifique-se de que DefaultUID e DefaultGID estejam definidos como 1000 e 100, respectivamente, para um usuário sem privilégios. Certifique-se de que ambos os valores estejam definidos como 0 para o usuário raiz.
  • Os diretórios “opt/.sagemakerinterna l” e “opt/ml” não são usados. Esses diretórios são reservados.
  • Ao criar o arquivo de configuração app-image-config-input.json, certifique-se de que o valor de Name (Nome) para KernelSpec nesse arquivo corresponda ao valor de Name (Nome) da imagem associada.

Exemplo de Dockerfile que instala pacotes Python e define o escopo para usuários não privilegiados:

FROM public.ecr.aws/amazonlinux/amazonlinux:2

ARG NB_USER="sagemaker-user"
ARG NB_UID="1000"
ARG NB_GID="100"

RUN \
    yum install --assumeyes python3 shadow-utils && \
    useradd --create-home --shell /bin/bash --gid "${NB_GID}" --uid ${NB_UID} ${NB_USER} && \
    yum clean all && \
    python3 -m pip install ipykernel && \
    python3 -m ipykernel install

USER ${NB_UID}

Você poderá visualizar as mensagens de erro nos logs do Amazon CloudWatch quando uma das seguintes situações acontecer:

  • A criação da versão da imagem falha.
  • Você receberá um erro ao iniciar a imagem no SageMaker Studio.

Essas mensagens podem ser encontradas no grupo de logs /aws/sagemaker/studio e no fluxo de logs $domainId/$userProfileName/KernelGateway/$appName.

Observação: este artigo pressupõe que o usuário ou perfil do AWS Identity and Access Management (IAM) tenha a política AmazonSageMakerFullAccess anexada a ele.


Informações relacionadas

Especificações de imagens personalizadas do SageMaker

AWS OFICIAL
AWS OFICIALAtualizada há um ano