Amazon SageMaker AI ノートブックインスタンスのデータをバックアップしたです。
簡単な説明
SageMaker AI のノートブックインスタンスは、Amazon Elastic Block Store (Amazon EBS) ボリュームを使用してデータを保存します。EBS ボリュームは /home/ec2-user/SageMaker ディレクトリにマウントされます。ノートブックインスタンスが稼働中または起動可能な場合、バックアップを作成し、そのバックアップを新しいノートブックに移行できます。
重要: バックアップを作成する前にノートブックインスタンスを削除した場合、ノートブックにアタッチされている EBS ボリュームも削除されます。
解決策
注: AWS コマンドラインインターフェイス (AWS CLI) コマンドの実行中にエラーが発生した場合は、「AWS CLI で発生したエラーのトラブルシューティング」を参照してください。また、AWS CLI の最新バージョンを使用していることを確認してください。
ノートブックインスタンスのバックアップを作成するには、ノートブックのターミナルまたはライフサイクル設定スクリプトを使用します。
ノートブックのターミナルを使用してバックアップを作成する
次の手順を実行します。
- Amazon Simple Storage Service (Amazon S3) バケットを作成します。
- S3 バケットにバックアップ用のフォルダを作成します。
- SageMaker AI コンソールを開きます。
- ナビゲーションペインで [ノートブックインスタンス] を選択し、該当するノートブックインスタンスを選択します。
- [アクション] で [Jupyter を開く] を選択します。
- ノートブックインスタンスのターミナルを開くには、[新規] を選択し、[ターミナル] を選択します。
- ノートブックインスタンスから S3 バケットフォルダにファイルをコピーするには、AWS CLI コマンド cp を実行します。
aws s3 cp --recursive /home/ec2-user/SageMaker/ s3://aws-s3-bucket/folder-name/
注: s3://aws-s3-bucket と folder-name は、実際の値に置き換えます。
- (オプション) S3 バケットから新しいノートブックインスタンスにファイルをコピーするには、AWS CLI コマンド cp を実行します。
aws s3 cp --recursive s3://aws-s3-bucket/folder-name/ /home/ec2-user/SageMaker/
注: s3://aws-s3-bucket と folder-name は、実際の値に置き換えます。
ライフサイクル設定スクリプトを使用してバックアップを作成する
次の手順を実行します。
- SageMaker AI コンソールを開きます。
- ナビゲーションペインで [ライフサイクル設定] を選択します。
- [設定を作成] を選択します。[名前] にバックアップの名前を入力します (例: ebs-backup)。
- [スクリプト] で [ノートブックの起動] タブを選択し、スクリプトを入力します。スクリプトの例については、GitHub のウェブサイトで amazon-sagemaker-notebook-instance-lifecycle-config-samples を参照してください。
注: [ノートブックの作成] タブは空白のままにします。
- [設定を作成] を選択します。
- ノートブックインスタンスに移動します。
注: インスタンスの状態が ** Stopped** である場合のみ、ライフサイクル設定を既存のノートブックインスタンスにアタッチできます。
- [編集] を選択します。
- [追加の設定] を選択します。
- [ライフサイクル設定] で該当する設定を選択します。
- [ノートブックインスタンスを更新] を選択します。
- [タグ] で [編集] を選択します。
- バケットのキー値を含むタグを追加します (例: sagemaker-ebs-backup-region-account_id)。
注: アタッチする実行ロールで、Amazon S3 の動機を実行するためのアクセス許可を付与する必要があります。
- [保存] を選択します。
- バックアップを作成するには、ノートブックインスタンスを起動します。
スナップショットは /home/ec2-user/SageMaker/ と類似したものであり、s3://ebs-backup-bucket/source-instance-name_snapshot-timestamp/ に配置されています。/home/ec2-user/SageMaker/BACKUP_COMPLETE というファイルが表示されている場合、バックアップは完了しています。
注: バックアップの処理時間は、ボリューム内にあるデータの合計サイズによって異なります。