Como soluciono problemas de conectividade de instâncias de notebook do SageMaker?
Não consigo iniciar um notebook do Amazon SageMaker e vejo erros intermitentes.
Breve descrição
Ao abrir um caderno Jupyter no SageMaker, o caderno pode parar de responder ou exibir erros.
Algumas causas comuns para isso são:
- O SageMaker não consegue estabelecer conexão entre o Jupyter e seu navegador.
- O Kernel do caderno atingiu seu período de tempo limite definido.
- Carga de utilização de recursos.
Resolução
Observação: se receber erros ao executar comandos da AWS Command Line Interface (AWS CLI), verifique se está usando a versão mais recente da AWS CLI.
Não é possível estabelecer conexão entre o Jupyter e o navegador
Às vezes, ao abrir um caderno Jupyter, você recebe o seguinte erro:
"A connection to the notebook server could not be established. The notebook will continue trying to reconnect. Check your network connection or notebook server configuration."
Essa mensagem ocorre quando há um problema de conexão entre o Jupyter e o navegador. Para solucionar a mensagem de falha na conexão, faça o seguinte:
- Reinicie sua instância de caderno. É uma prática recomendada reiniciar regularmente as instâncias de caderno. A reinicialização ajuda a manter o software da instância de caderno atualizado. Quando você reinicia, a instância de caderno é movida para um novo host. Reiniciar o caderno também ajuda a resolver erros HTTP 503 e 504 no navegador.
- Reinicie o navegador, limpe o cache do navegador ou tente usar um navegador diferente.
- Use uma conexão de rede diferente.
- Verifique se o software de firewall, proxy ou antivírus está bloqueando a conexão.
- Verifique o log de todos os WebSockets em seu navegador. Essa configuração geralmente é encontrada no modo de desenvolvedor do navegador.
- Desative temporariamente todas as extensões do navegador e tente novamente.
O kernel do caderno atingiu seu período de tempo limite definido
O token de sessão do caderno Jupyter tem validade máxima de 12 horas. Depois que o token expirar, a sessão expira e deve ser atualizada para redefinir o token de tempo limite. No entanto, o kernel do Jupyter continua funcionando mesmo se o navegador se desconectar.
Para mitigar os efeitos do token de 12 horas, faça o seguinte:
- Grave os resultados do programa em um arquivo em vez de usar stdout.
- Converta seu programa em um script Python e execute-o.
- Faça uma chamada para CreatePresignedNotebookInstanceURL para gerar um novo URL com AuthToken. Em seguida, cole o novo URL em seu navegador antes que a sessão expire. Isso gera um novo token de sessão de 12 horas:
aws sagemaker create-presigned-notebook-instance-url —notebook- instance-name <instance name> } "AuthorizedUrl": "https:// name>.notebook. <region>.sagemaker.aws? AuthToken=<authToken>" {
- Acesse diretamente o AuthorizedUrl. Isso é o mesmo que escolher o Open Jupyter no console do SageMaker.
- Você pode modificar o URL para adicionar "view=Lab&" à seguinte fórmula para abrir o JupyterLab:
"https:// name>.notebook.
.sagemaker.aws? view=Lab&AuthToken=
"
Atingiu o limite de utilização de recursos
Verifique os recursos do sistema para sua instância de notebook do SageMaker para garantir que eles estejam sendo executados em níveis de carga aceitáveis. Para verificar os recursos da instância de notebook do SageMaker, digite os seguintes comandos no terminal de notebook:
Para verificar a utilização da memória:
free -h
Para verificar a utilização da CPU:
top
Para verificar a utilização do disco:
df -h
Se você observar uma alta utilização de CPU, memória ou disco, experimente estas soluções:
- Reinicie a instância de notebook e tente novamente.
- Analise o tipo de instância de notebook do SageMaker para verificar se ele tem o escopo adequado e está configurado para suas tarefas.
Informações relacionadas
Solucionar problemas ao abrir um caderno Jupyter no Amazon SageMaker
Solucionar o erro de capacidade insuficiente no Amazon SageMaker
Conteúdo relevante
- AWS OFICIALAtualizada há um ano
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há 2 anos