Come posso risolvere i problemi di connettività delle istanze del notebook SageMaker?

4 minuti di lettura
0

Non riesco ad avviare un notebook Amazon SageMaker e vedo errori intermittenti.

Breve descrizione

Quando viene aperto un notebook Jupyter SageMaker, il notebook potrebbe non rispondere o mostrare degli errori.

Spesso ciò è dovuto a uno dei seguenti fattori:

  • SageMaker non è in grado di stabilire una connessione tra Jupyter e il suo browser.
  • Il kernel del notebook ha raggiunto il periodo di timeout predefinito.
  • Carico di utilizzo delle risorse.

Risoluzione

Nota: se ricevi messaggi di errore durante l'esecuzione dei comandi dell'Interfaccia della linea di comando AWS (AWS CLI), assicurati di star utilizzando la versione più recente di AWS CLI.

Impossibile stabilire una connessione tra Jupyter e il browser

A volte quando si apre un notebook Jupyter viene visualizzato il seguente errore:

"Non è stato possibile stabilire una connessione al server del notebook. Il notebook continuerà a tentare di riconnettersi. Verifica la connessione di rete o la configurazione del server del notebook".

Questo messaggio appare quando c'è un problema di connessione tra Jupyter e il browser. Per risolvere il problema relativo al messaggio di connessione non riuscita, procedi come segue:

  • Riavvia l'istanza del notebook. È consigliabile riavviare regolarmente le istanze del notebook. Il riavvio aiuta a mantenere aggiornato il software delle istanze del notebook. Al riavvio, l'istanza del notebook si sposta su un nuovo host. Il riavvio del notebook aiuta anche a risolvere gli errori HTTP 503 e 504 nel browser.
  • Riavvia il browser, svuota la cache del browser o prova un altro browser.
  • Usa una connessione di rete diversa.
  • Controlla se il firewall, il proxy o il software antivirus stanno bloccando la connessione.
  • Controlla il log di tutti i WebSocket nel tuo browser. Questa impostazione si trova in genere nella modalità sviluppatore del browser.
  • Disattiva temporaneamente tutte le estensioni del browser, quindi riprova.

Il kernel del notebook ha raggiunto il periodo di timeout definito

Il token di sessione del notebook Jupyter ha una validità massima di 12 ore. Dopo la scadenza del token, la sessione scade e deve essere aggiornata per reimpostare il token di timeout. Tuttavia, il kernel Jupyter continua a funzionare anche se il browser si disconnette.

Per attenuare gli effetti del token di 12 ore, procedi come segue:

  • Scrivi i risultati del programma in un file anziché usare stdout.
  • Converti il tuo programma in uno script Python e poi eseguilo.
  • Effettua una chiamata a CreatePresignedNotebookInstanceURL per generare un nuovo URL con AuthToken. Quindi incolla il nuovo URL nel browser prima della scadenza della sessione. Questo genera un nuovo token di sessione di 12 ore:
aws sagemaker create-presigned-notebook-instance-url —notebook- instance-name <instance name> 
}
"AuthorizedUrl": "https:// name>.notebook. <region>.sagemaker.aws? AuthToken=<authToken>"
{
  • Vai direttamente a AuthorizedUrl. Equivale a scegliere Open Jupyter (Apri Jupyter) nella console SageMaker.
  • Puoi modificare l'URL per aggiungere «view=lab&» al seguente modulo e aprire JupyterLab:
    "https:// name>.notebook.

.sagemaker.aws? view=Lab&AuthToken=

"

Limite di utilizzo delle risorse raggiunto

Controlla le risorse di sistema per l'istanza del notebook SageMaker per assicurarti che queste funzionino a livelli di carico accettabili. Per controllare le risorse delle istanze del notebook SageMaker, immetti i seguenti comandi nel terminale del Notebook:

Per verificare l'utilizzo della memoria:

free -h

Per verificare l'utilizzo della CPU:

top

Per verificare l'utilizzo del disco:

df -h

Se riscontri un utilizzo elevato della CPU, della memoria o del disco, prova le seguenti soluzioni:


Informazioni correlate

Risoluzione dei problemi relativi all'apertura di un notebook Jupyter Amazon SageMaker

Risoluzione dell'errore di capacità insufficiente in Amazon SageMaker

AWS UFFICIALE
AWS UFFICIALEAggiornata 3 mesi fa