SageMaker Notebook インスタンスの接続に関する問題をトラブルシューティングする方法を教えてください。

所要時間1分
0

Amazon SageMaker Notebook を起動できず、断続的にエラーが発生します。

簡単な説明

SageMaker Jupyter Notebook を開くと、Notebook が応答しなくなることやエラーが表示されることがあります。

この問題の一般的な原因は次のとおりです。

  • SageMaker が Jupyter とそのブラウザ間の接続を確立できない。
  • Notebook カーネルが定義済みタイムアウト期間に達した。
  • リソースの使用負荷。

解決方法

注: AWS コマンドラインインターフェイス (AWS CLI) のコマンド実行中にエラーが発生した場合は、AWS CLI の最新バージョンを使用していることを確認してください

Jupyter とブラウザ間の接続が確立できない

Jupyter Notebook を開くと、次のエラーが表示されることがあります。

「A connection to the notebook server could not be established.The notebook will continue trying to reconnect.Check your network connection or notebook server configuration.」(Notebook サーバーへの接続を確立できませんでした。Notebook は引き続き再接続を試みます。ネットワーク接続または Notebook サーバーの設定を確認してください。)

このメッセージは、Jupyter とブラウザ間の接続に問題がある場合に表示されます。接続失敗メッセージのトラブルシューティングを行うには、次の操作を行います。

  • Notebook インスタンスを再起動します。Notebook インスタンスを定期的に再起動することがベストプラクティスです。再起動すると、Notebook インスタンスソフトウェアを最新の状態に保つことができます。再起動すると、Notebook インスタンスは基盤となる新しいホストに移行します。Notebook の再起動は、ブラウザの HTTP 503 および 504 エラーの解決にも役立ちます。
  • ブラウザのキャッシュをクリアするか、別のブラウザを試します。
  • 別のネットワークを使用して接続します。
  • ファイアウォール、プロキシ、またはウイルス対策ソフトウェアが接続をブロックしていないことを確認します。
  • ブラウザのすべての WebSocket のログを確認します。この設定には、通常、ブラウザのデベロッパーモードでアクセスできます。
  • すべてのブラウザ拡張機能を一時的にオフにしてから、もう一度試してみます。

Notebook カーネルが定義済みタイムアウト期間に達した

Jupyter Notebook セッショントークンの最大有効期間は 12 時間です。トークンの有効期限が切れると、セッションがタイムアウトになるため、更新してタイムアウトトークンをリセットする必要があります。ただし、ブラウザが切断されても Jupyter カーネルは引き続き実行されます。

12 時間のトークンの影響を軽減するには、次の操作を行います。

  • stdout を使用する代わりに、プログラムの結果をファイルに書き込みます。
  • プログラムを Python スクリプトに変換して実行します。
  • CreatePresignedNotebookInstanceURL を呼び出して、AuthTokenを使用して新しい URL を生成します。次に、セッションの有効期限が切れる前に新しい URL をブラウザに貼り付けます。これで新しい 12 時間のセッショントークンが生成されます。
aws sagemaker create-presigned-notebook-instance-url —notebook- instance-name <instance name> 
}
"AuthorizedUrl": "https:// name>.notebook. <region>.sagemaker.aws? AuthToken=<authToken>"
{
  • AuthorizedUrl に直接移動します。これは SageMaker コンソールから [Open Jupyter] (Jupyter を開く) を選択するのと同じです。
  • URL を変更して、次のフォームに「view=Lab&」を追加すると JupyterLab を開くことができます。
    "https:// name>.notebook.

.sagemaker.aws? view=Lab&AuthToken=

"

リソース使用量の上限に達した

SageMaker Notebook インスタンスのシステムリソースをチェックして、許容可能な負荷レベルで動作していることを確認します。SageMaker Notebook インスタンスのリソースを確認するには、Notebook ターミナルで以下のコマンドを入力します。

メモリ使用率を確認するには:

free -h

CPU 使用率を確認するには:

top

ディスク使用率を確認するには:

df -h

CPU、メモリ、またはディスクの使用率が高い場合は、次の解決策を試してください。

  • Notebook インスタンスを再起動して、もう一度試します。
  • SageMaker Notebook のインスタンスタイプを確認して、そのスコープがジョブに合わせて正しく設定されていることを確認します。

関連情報

Amazon SageMaker ノートブックインスタンスで Jupyter を開くことができない

Amazon SageMaker リソースを起動する際の容量不足エラーをトラブルシューティングする方法を教えてください。

AWS公式
AWS公式更新しました 1年前
コメントはありません