Comment résoudre les problèmes liés au transfert de mon conteneur personnalisé vers Amazon SageMaker Studio ?

Lecture de 3 minute(s)
0

Je souhaite résoudre les problèmes liés à la création d'un Amazon SageMaker Studio personnalisé.

Solution

Une image SageMaker est un fichier qui identifie les noyaux, les modules linguistiques et les autres dépendances nécessaires pour exécuter un bloc-notes Jupyter dans SageMaker Studio. Ces images sont utilisées pour créer un environnement à partir duquel vous pouvez exécuter vos blocs-notes Jupyter. Si les images intégrées fournies par SageMaker ne sont pas compatibles avec votre cas d'utilisation, vous pouvez créer une image personnalisée à utiliser dans SageMaker Studio.

Vous pouvez rencontrer des erreurs lors de l'utilisation de votre image client dans SageMaker Studio. Ces erreurs peuvent résulter principalement d'une configuration incorrecte que vous avez configurée lors du processus de création de l'image du conteneur. Par conséquent, assurez-vous que l'image personnalisée est compatible avec SageMaker Studio.

Pour ce faire, vérifiez les points suivants lorsque vous créez le Dockerfile :

  • Vous avez défini les valeurs DefaultUID et DefaultGID avec précision. SageMaker Studio ne prend en charge qu'une combinaison spécifique deDefaultUID et DefaultGID. Assurez-vous que DefaultUID et DefaultGID sont définis sur 1 000 et 100, respectivement pour un utilisateur non privilégié. Assurez-vous que les valeurs sont toutes deux définies sur 0 pour l'utilisateur root.
  • Les répertoires « opt/.sagemakerinterna » et « opt/ml » ne sont pas utilisés. Ces répertoires sont réservés.
  • Lorsque vous créez le fichier de configuration app-image-config-input.json, assurez-vous que la valeur du nom de KernelSpec dans ce fichier correspond à la valeur du nom de l'image associée.

Exemple de Dockerfile qui installe des packages Python et définit le périmètre pour les utilisateurs non privilégiés :

FROM public.ecr.aws/amazonlinux/amazonlinux:2

ARG NB_USER="sagemaker-user"
ARG NB_UID="1000"
ARG NB_GID="100"

RUN \
    yum install --assumeyes python3 shadow-utils && \
    useradd --create-home --shell /bin/bash --gid "${NB_GID}" --uid ${NB_UID} ${NB_USER} && \
    yum clean all && \
    python3 -m pip install ipykernel && \
    python3 -m ipykernel install

USER ${NB_UID}

Vous pouvez consulter les messages d'erreur dans les Amazon CloudWatch Logs lorsque l'une des situations suivantes se produit :

  • La création de version d'image échoue.
  • Un message d'erreur s'affiche lorsque vous lancez l'image dans SageMaker Studio.

Vous pouvez trouver ces messages dans le groupe de journaux /aws/sagemaker/studio et dans le flux de journaux $domainID/$userProfileName/KernelGateway/$appName.

Remarque : cet article part du principe que la politique AmazonSageMakerFullAccess est associée à l'utilisateur ou au rôle AWS Identity and Access Management (IAM).


Informations connexes

Spécifications des images SageMaker personnalisées

AWS OFFICIEL
AWS OFFICIELA mis à jour il y a un an