跳至內容

如何備份 SageMaker AI 筆記本執行個體資料?

2 分的閱讀內容
0

我想備份 Amazon SageMaker AI 筆記本執行個體資料。

簡短描述

SageMaker AI 筆記型電腦執行個體使用Amazon Elastic Block Store (Amazon EBS) 磁碟區來儲存資料。將 EBS 磁碟區掛載到 /home/ec2-user/SageMaker 目錄。當筆記本執行個體處於服務狀態或可啟動狀態時,您可以建立備份並將備份遷移到新的筆記本。

**重要:**如果您在建立備份之前刪除筆記本執行個體,則也會刪除附加到筆記本的 EBS 磁碟區。

解決方法

**注意:**如果您在執行 AWS Command Line Interface (AWS CLI) 命令時收到錯誤訊息,請參閱對 AWS CLI 錯誤進行疑難排解。此外,請確定您使用的是最新的 AWS CLI 版本

若要建立筆記本執行個體的備份,請使用筆記型電腦終端或生命週期組態指令碼。

使用筆記本終端建立備份

請完成下列步驟:

  1. 建立 Amazon Simple Storage Service (Amazon S3) 儲存貯體
  2. 在 S3 儲存貯體中建立一個資料夾用於備份。
  3. 開啟 SageMaker AI console (SageMaker AI 主控台)。
  4. 在導覽窗格中,選擇 Notebook instances (筆記本執行個體),然後選取您的筆記本執行個體。
  5. Actions (動作) 下,選擇 Open Jupyter (開啟 Jupyter)。
  6. 若要開啟筆記本執行個體終端,請選擇 New (新建),然後選擇 Terminal (終端)。
  7. 若要將檔案從筆記本執行個體複製到 S3 儲存貯體資料夾,請執行 cp AWS CLI 命令:
    aws s3 cp --recursive /home/ec2-user/SageMaker/ s3://aws-s3-bucket/folder-name/
    **注意:**將 s3://aws-s3-bucketfolder-name 替換為您的值。
  8. (選用) 若要將檔案從 S3 儲存貯體複製到新的筆記本執行個體,請執行 cp AWS CLI 命令:
    aws s3 cp --recursive s3://aws-s3-bucket/folder-name/ /home/ec2-user/SageMaker/
    **注意:**將 s3://aws-s3-bucketfolder-name 替換為您的值。

使用生命週期組態指令碼來建立備份

請完成下列步驟:

  1. 開啟 SageMaker AI console (SageMaker AI 主控台)。
  2. 在導覽窗格中,選擇 Lifecycle configurations (生命週期組態)。
  3. 選擇 Create configuration (建立組態)。在 Name (名稱) 中,輸入備份的名稱,例如 ebs-backup
  4. Scripts (指令碼) 下,選擇 Start notebook (開始筆記本) 索引標籤,然後輸入您的指令碼。如需指令碼範例,請參閱 GitHub 網站上的 amazon-sagemaker-notebook-instance-lifecycle-config-samples
    **注意:**將 Create notebook (建立記事本) 索引標籤保持空白。
  5. 選擇 Create configuration (建立組態)。
  6. 瀏覽至您的筆記本執行個體。
    注意:只有當執行個體處於已停止狀態時,您才能將生命週期組態附加到現有的筆記本執行個體。
  7. 選擇 Edit (編輯)。
  8. 選擇 Additional configuration (其他組態)。
  9. Lifecycle configuration (生命週期組態) 中,選取您的組態。
  10. 選擇 Update notebook instance (更新筆記本執行個體)。
  11. Tags (標籤) 下,選擇 Edit (編輯)。
  12. 為您的儲存貯體新增一個帶有鍵值的標籤,例如 sagemaker-ebs-backup-region-account_id
    注意:附加的執行角色必須允許執行 Amazon S3 同步的權限
  13. 選擇 Save (儲存)。
  14. 若要建立備份,請啟動筆記本執行個體。

該快照看起來類似於 /home/ec2-user/SageMaker/,您可以在 s3://ebs-backup-bucket/source-instance-name_snapshot-timestamp/ 中找到它。當您看到檔案 /home/ec2-user/SageMaker/BACKUP_COMPLETE 時,備份即完成。

**注意:**備份程序的時間取決於磁碟區中資料的總大小。

AWS 官方已更新 1 年前