Como soluciono problemas de conectividade de instâncias de notebook do SageMaker?

4 minuto de leitura
0

Não consigo iniciar um notebook do Amazon SageMaker e vejo erros intermitentes.

Breve descrição

Ao abrir um caderno Jupyter no SageMaker, o caderno pode parar de responder ou exibir erros.

Algumas causas comuns para isso são:

  • O SageMaker não consegue estabelecer conexão entre o Jupyter e seu navegador.
  • O Kernel do caderno atingiu seu período de tempo limite definido.
  • Carga de utilização de recursos.

Resolução

Observação: se receber erros ao executar comandos da AWS Command Line Interface (AWS CLI), verifique se está usando a versão mais recente da AWS CLI.

Não é possível estabelecer conexão entre o Jupyter e o navegador

Às vezes, ao abrir um caderno Jupyter, você recebe o seguinte erro:

"A connection to the notebook server could not be established. The notebook will continue trying to reconnect. Check your network connection or notebook server configuration."

Essa mensagem ocorre quando há um problema de conexão entre o Jupyter e o navegador. Para solucionar a mensagem de falha na conexão, faça o seguinte:

  • Reinicie sua instância de caderno. É uma prática recomendada reiniciar regularmente as instâncias de caderno. A reinicialização ajuda a manter o software da instância de caderno atualizado. Quando você reinicia, a instância de caderno é movida para um novo host. Reiniciar o caderno também ajuda a resolver erros HTTP 503 e 504 no navegador.
  • Reinicie o navegador, limpe o cache do navegador ou tente usar um navegador diferente.
  • Use uma conexão de rede diferente.
  • Verifique se o software de firewall, proxy ou antivírus está bloqueando a conexão.
  • Verifique o log de todos os WebSockets em seu navegador. Essa configuração geralmente é encontrada no modo de desenvolvedor do navegador.
  • Desative temporariamente todas as extensões do navegador e tente novamente.

O kernel do caderno atingiu seu período de tempo limite definido

O token de sessão do caderno Jupyter tem validade máxima de 12 horas. Depois que o token expirar, a sessão expira e deve ser atualizada para redefinir o token de tempo limite. No entanto, o kernel do Jupyter continua funcionando mesmo se o navegador se desconectar.

Para mitigar os efeitos do token de 12 horas, faça o seguinte:

  • Grave os resultados do programa em um arquivo em vez de usar stdout.
  • Converta seu programa em um script Python e execute-o.
  • Faça uma chamada para CreatePresignedNotebookInstanceURL para gerar um novo URL com AuthToken. Em seguida, cole o novo URL em seu navegador antes que a sessão expire. Isso gera um novo token de sessão de 12 horas:
aws sagemaker create-presigned-notebook-instance-url —notebook- instance-name <instance name> 
}
"AuthorizedUrl": "https:// name>.notebook. <region>.sagemaker.aws? AuthToken=<authToken>"
{
  • Acesse diretamente o AuthorizedUrl. Isso é o mesmo que escolher o Open Jupyter no console do SageMaker.
  • Você pode modificar o URL para adicionar "view=Lab&" à seguinte fórmula para abrir o JupyterLab:
    "https:// name>.notebook.

.sagemaker.aws? view=Lab&AuthToken=

"

Atingiu o limite de utilização de recursos

Verifique os recursos do sistema para sua instância de notebook do SageMaker para garantir que eles estejam sendo executados em níveis de carga aceitáveis. Para verificar os recursos da instância de notebook do SageMaker, digite os seguintes comandos no terminal de notebook:

Para verificar a utilização da memória:

free -h

Para verificar a utilização da CPU:

top

Para verificar a utilização do disco:

df -h

Se você observar uma alta utilização de CPU, memória ou disco, experimente estas soluções:


Informações relacionadas

Solucionar problemas ao abrir um caderno Jupyter no Amazon SageMaker

Solucionar o erro de capacidade insuficiente no Amazon SageMaker

AWS OFICIAL
AWS OFICIALAtualizada há 3 meses