Comment puis-je sauvegarder les données de mon instance de notebook SageMaker AI ?

Lecture de 3 minute(s)
0

Je souhaite sauvegarder les données de mon instance de notebook Amazon SageMaker AI.

Brève description

Les instances de notebook SageMaker AI utilisent les volumes Amazon Elastic Block Store (Amazon EBS) pour stocker les données. Vous montez le volume EBS dans le répertoire /home/ec2-user/SageMaker. Lorsqu'une instance de notebook est en service ou disponible pour démarrer, vous pouvez créer une sauvegarde et la migrer vers un nouveau notebook.

Important : Si vous supprimez l'instance de notebook avant de créer une sauvegarde, le volume EBS associé au notebook est également supprimé.

Résolution

Remarque : Si des erreurs surviennent lorsque vous exécutez des commandes de l'interface de la ligne de commande AWS (AWS CLI), consultez la section Résoudre des erreurs liées à l’AWS CLI. Vérifiez également que vous utilisez bien la version la plus récente de l’AWS CLI.

Pour créer une sauvegarde de votre instance de notebook, utilisez le terminal de notebook ou un script de configuration du cycle de vie.

Utiliser le terminal de notebook pour créer une sauvegarde

Procédez comme suit :

  1. Créez un compartiment Amazon Simple Storage Service (Amazon S3).
  2. Créez un dossier dans le compartiment S3 pour votre sauvegarde.
  3. Ouvrez la console SageMaker AI.
  4. Dans le volet de navigation, choisissez Instances de notebook, puis sélectionnez votre instance de notebook.
  5. Sous Actions, choisissez Ouvrir Jupyter.
  6. Pour ouvrir votre terminal d'instance de notebook, choisissez Nouveau, puis Terminal.
  7. Pour copier les fichiers de votre instance de notebook vers votre dossier de compartiment S3, exécutez la commande cp de l’interface de ligne de commande AWS :
    aws s3 cp --recursive /home/ec2-user/SageMaker/ s3://aws-s3-bucket/folder-name/
    Remarque : Remplacez s3://aws-s3-bucket et folder-name par vos valeurs.
  8. (Facultatif) Pour copier des fichiers de votre compartiment S3 vers une nouvelle instance de notebook, exécutez la commande cp de l’interface de ligne de commande AWS :
    aws s3 cp --recursive s3://aws-s3-bucket/folder-name/ /home/ec2-user/SageMaker/
    Remarque : Remplacez s3://aws-s3-bucket et folder-name par vos valeurs.

Utiliser un script de configuration du cycle de vie pour créer une sauvegarde

Procédez comme suit :

  1. Ouvrez la console SageMaker AI.
  2. Dans le volet de navigation, choisissez Configurations du cycle de vie.
  3. Choisissez Créer une configuration. Dans Nom, saisissez un nom pour la sauvegarde, par exemple ebs-backup.
  4. Sous Scripts, choisissez l'onglet Démarrer le notebook, puis saisissez votre script. Pour un exemple de script, consultez la page amazon-sagemaker-notebook-instance-lifecycle-config-samples sur le site Web de GitHub.
    Remarque : Laissez l'onglet Créer un notebook vide.
  5. Choisissez Créer une configuration.
  6. Accédez à votre instance de notebook.
    Remarque : Vous pouvez associer une configuration du cycle de vie à une instance de notebook existante uniquement lorsque l'instance est à l'état Arrêté.
  7. Sélectionnez Modifier.
  8. Sélectionnez Configuration supplémentaire.
  9. Pour Configuration du cycle de vie, sélectionnez votre configuration.
  10. Choisissez Mettre à jour l'instance de notebook.
  11. Sous Identifications, choisissez Modifier.
  12. Ajoutez une identification avec une valeur clé pour votre compartiment, par exemple sagemaker-ebs-backup-region-account_id.
    Remarque : Le rôle d'exécution associé doit accorder des autorisations nécessaires pour effectuer une synchronisation Amazon S3.
  13. Sélectionnez Enregistrer.
  14. Pour créer une sauvegarde, démarrez l'instance de notebook.

L'instantané ressemble à /home/ec2-user/SageMaker/, et vous pouvez le trouver dans s3://ebs-backup-bucket/source-instance-name_snapshot-timestamp/. La sauvegarde est terminée lorsque vous voyez apparaître le fichier /home/ec2-user/SageMaker/BACKUP_COMPLETE.

Remarque : La durée du processus de sauvegarde dépend de la taille totale des données du volume.

AWS OFFICIEL
AWS OFFICIELA mis à jour il y a un mois