Come posso risolvere gli errori che si verificano quando porto il mio container personalizzato su Amazon SageMaker Studio?

2 minuti di lettura
0

Desidero risolvere gli errori relativi alla creazione di un Amazon SageMaker Studio personalizzato.

Risoluzione

Un'immagine SageMaker è un file che identifica i kernel, i pacchetti di linguaggi e altre dipendenze necessarie per eseguire un notebook Jupyter in SageMaker Studio. Queste immagini vengono utilizzate per creare un ambiente da cui è possibile eseguire i notebook Jupyter. Se le immagini integrate fornite da SageMaker non supportano il tuo caso d'uso, puoi portare e utilizzare un'immagine personalizzata in SageMaker Studio.

Potresti ricevere messaggi di errore quando utilizzi l'immagine del cliente in SageMaker Studio. Questi errori possono derivare principalmente da una configurazione errata impostata durante il processo di creazione dell'immagine del container. Pertanto, assicurati che l'immagine personalizzata sia compatibile con SageMaker Studio.

Per farlo, controlla quanto segue quando crei il Dockerfile:

  • I valori DefaultUID e DefaultGID sono stati impostati con precisione. SageMaker Studio supporta solo una combinazione specifica di DefaultUID e DefaultGID. Assicurati che DefaultUID e DefaultGID siano impostati su 1000 e 100, rispettivamente per un utente senza privilegi. Assicurati che i valori siano entrambi impostati su 0 per l'utente root.
  • Le directory "opt/.sagemakerinternal" e "opt/ml" non vengono utilizzate. Si tratta di directory riservate.
  • Quando crei il file di configurazione app-image-config-input.json, assicurati che il valore Name per KernelSpec in questo file corrisponda al valore Name dell'immagine associata.

Esempio di Dockerfile che installa i pacchetti Python e imposta l'ambito per gli utenti senza privilegi:

FROM public.ecr.aws/amazonlinux/amazonlinux:2

ARG NB_USER="sagemaker-user"
ARG NB_UID="1000"
ARG NB_GID="100"

RUN \
    yum install --assumeyes python3 shadow-utils && \
    useradd --create-home --shell /bin/bash --gid "${NB_GID}" --uid ${NB_UID} ${NB_USER} && \
    yum clean all && \
    python3 -m pip install ipykernel && \
    python3 -m ipykernel install

USER ${NB_UID}

Puoi visualizzare i messaggi di errore nei file di log Amazon CloudWatch quando si verifica una delle seguenti situazioni:

  • La creazione della versione dell'immagine non va a buon fine.
  • Ricevi un messaggio di errore al lancio dell'immagine in SageMaker Studio.

Puoi trovare questi messaggi nel gruppo di log /aws/sagemaker/studio e nel flusso di log $domainID/$userProfileName/KernelGateway/$appName.

Nota: questo articolo presuppone che all'utente o al ruolo AWS Identity and Access Management (IAM) sia associata la policy AmazonSageMakerFullAccess.


Informazioni correlate

Specifiche delle immagini SageMaker personalizzate

AWS UFFICIALE
AWS UFFICIALEAggiornata un anno fa