如何疑難排解 SageMaker 筆記本執行個體連線問題?

1 分的閱讀內容
0

我無法啟動 Amazon SageMaker 筆記本,且我看到間歇性錯誤。

簡短描述

開啟 SageMaker Jupyter 筆記本,筆記本可能會變得沒有回應或顯示錯誤。

造成這種情況的一些常見原因是:

  • SageMaker 無法在 Jupyter 與其瀏覽器之間建立連線。
  • 筆記本內核達到其定義的逾時期限。
  • 資源使用率負載。

解決方案

**注意:**如果您在執行 AWS Command Line Interface (AWS CLI) 命令時收到錯誤,請確保您使用的是最新的 AWS CLI 版本

無法在 Jupyter 和瀏覽器之間建立連接

有時,當打開 Jupyter 筆記本時,您會收到以下錯誤:

"A connection to the notebook server could not be established.The notebook will continue trying to reconnect.Check your network connection or notebook server configuration. (無法建立與筆記型電腦伺服器的連線,筆記本將繼續嘗試重新連線。請檢查網路連線或筆記型電腦伺服器組態。)"

當 Jupyter 和瀏覽器之間出現連線問題時,就會出現此訊息。若要疑難排解連線失敗訊息,請執行下列動作:

  • 重新啟動筆記本執行個體。最佳作法是定期重新啟動筆記本執行個體。重新啟動有助於將筆記本執行個體軟體保持在最新版本。當您重新啟動時,筆記本執行個體會移至新主機。重新啟動筆記本電腦也有助於解決瀏覽器中的 HTTP 503 和 504 錯誤。
  • 重新啟動瀏覽器、清除瀏覽器快取,或嘗試使用其他瀏覽器。
  • 使用不同的網路連線。
  • 檢查防火牆、Proxy 或防毒軟體是否封鎖了連線。
  • 檢查瀏覽器中所有 WebSocket 的日誌。通常可在瀏覽器的開發人員模式中找到此設定。
  • 暫時關閉所有瀏覽器擴充功能,然後再試一次。

筆記本內核達到其定義的逾時期限

Jupyter 筆記本工作階段權杖的有效期上限為 12 小時。權杖到期後,工作階段逾時且必須重新整理才能重設逾時權杖。但是,即使瀏覽器中斷連接,Jupyter 內核仍會繼續執行。

要緩解 12 小時權杖的影響,請執行以下操作:

  • 將程序的結果寫入文件,而不是使用 stdout
  • 將您的程序轉換為 Python 指令碼,然後執行。
  • 呼叫 CreatePresignedNotebookInstanceURL 以使用 AuthToken 產生新的 URL。接下來,在工作階段過期之前將新 URL 貼到瀏覽器中。這將產生一個新的 12 小時工作階段權杖:
aws sagemaker create-presigned-notebook-instance-url —notebook- instance-name <instance name> 
}
"AuthorizedUrl": "https:// name>.notebook. <region>.sagemaker.aws? AuthToken=<authToken>"
{
  • 直接前往 AuthorizedUrl。這與從 SageMaker 主控台中選擇 Open Jupyter (開啟 Jupyter) 相同。
  • 您可以修改網址,將「view=Lab&」新增至下列表單以開啟 JupyterLab:
    「https:// name>.notebook.

.sagemaker.aws? view=Lab&AuthToken=

達到資源使用上限

檢查 SageMaker 筆記本執行個體的系統資源,以確保其是以可接受的負載等級執行。若要檢查 SageMaker 筆記本執行個體資源,請在筆記本終端中輸入下列命令:

若要檢查記憶體使用率:

free -h

若要檢查 CPU 使用率:

top

若要檢查磁碟使用率:

df -h

如果您看到 CPU、記憶體或磁碟使用率很高,請嘗試下列解決方案:


相關資訊

疑難排解開啟 Amazon SageMaker Jupyter 筆記本時的問題

疑難排解 Amazon SageMaker 中的容量不足錯誤

AWS 官方
AWS 官方已更新 2 年前