Ir para o conteúdo

Por que não consigo iniciar o Amazon SageMaker Studio?

6 minuto de leitura
0

Quero solucionar os problemas que recebo quando tento iniciar o Amazon SageMaker Studio.

Resolução

Para identificar o problema responsável pela falha na inicialização do SageMaker Studio, use o Amazon CloudWatch Logs para analisar se há erros nas aplicações. Para analisar os CloudWatch Logs, conclua as seguintes etapas:

  1. Abra o console do CloudWatch.
  2. No painel de navegação, em Logs, escolha Grupos de logs.
  3. Na página Grupos de logs, pesquise por /aws/sagemaker/studio.
  4. Nos fluxos de logs exibidos, selecione o fluxo de logs da aplicação que falhou ao iniciar.
  5. Filtre o fluxo de logs pelo período de falha ao iniciar.
  6. Analise os logs que contêm mensagens de erro ou exceção.

Se o SageMaker Studio falhar ao iniciar devido a um problema de configuração de rede, gere um arquivo HAR para revisar o código de erro HTTP.

Conclua a resolução do seu problema.

Erros de script de configuração do ciclo de vida

Se você anexar configurações incorretas do ciclo de vida ao nível de domínio do seu SageMaker Studio ou perfil de usuário, a aplicação poderá falhar ao iniciar.

Para solucionar problemas de script de configuração do ciclo de vida, conclua as seguintes etapas:

  1. Abre o Console do CloudWatch.
  2. No painel de navegação, em Logs, escolha Grupos de logs.
  3. Na barra de pesquisa, digite /aws/sagemaker/studio e selecione o resultado.
  4. Nos fluxos de logs que aparecem, escolha [domain-id]/[user-profile-name]/[app-type]/[app-name]/LifecycleConfigOnStart.
  5. Filtre o fluxo de logs pelo período de falha ao iniciar.
  6. Depois de identificar o erro, desconecte seu script de ciclo de vida atual.
  7. Crie e anexe um novo script de ciclo de vida.

Erro na tela de carregamento

Se a tela de carregamento não responder, você receberá a seguinte mensagem:

"The loading screen is taking too long. Would you like to clear the workspace or keep waiting"

Para resolver esse erro, realize as etapas a seguir:

  1. Limpe o cache e os cookies do seu navegador atual.
  2. Saia do Console de Gerenciamento da AWS e, em seguida, faça login novamente.
  3. Abra a aplicação do SageMaker Studio.

Se você ainda receber uma mensagem de erro na tela de carregamento, abra o SageMaker Studio em outro navegador.

Para SageMaker Studio no modo somente VPC, certifique-se de anexar os endpoints necessários às sub-redes associadas ao seu domínio. Para obter mais informações, consulte Requisitos para usar o modo somente VPC.

Se o inicializador do SageMaker Studio não aparecer, reconfigure seu espaço de trabalho. Acesse o URL que aparece ao tentar iniciar o SageMaker Studio. No final do URL, se ?=reset estiver faltando, adicione-o e pressione Enter.

Erros da aplicação JupyterServer

Se a aplicação JupyterServer encontrar um problema, você receberá a seguinte mensagem:

"The JupyterServer app default encountered a problem and was stopped. Restart Now"

Para resolver esse erro, exclua todas as aplicações do SageMaker Studio do usuário.

Conclua as etapas a seguir:

  1. Abra o console do SageMaker IA.
  2. No painel de navegação, escolha Configurações do administrador e, em seguida, Domínios.
  3. Selecione seu domínio.
  4. Em Perfis de usuário, selecione um usuário.
  5. Na página Detalhes do usuário, para cada aplicação que não apresentou falha na lista de aplicações, escolha Ação.
  6. Na lista suspensa, escolha Excluir.
  7. Na caixa de diálogo Excluir aplicação, escolha Sim, excluir aplicação. Na caixa de diálogo de confirmação, digite excluir e escolha Excluir.
  8. Depois de excluir todas as aplicações do usuário, escolha Iniciar aplicação e, em seguida, Studio.
  9. Repita as etapas 4 a 8 para cada usuário em Perfis de usuário.

O SageMaker Studio reinicia o caderno Jupyter. Se o problema não for resolvido, remova os perfis de usuário e recrie os perfis.

Observação: se você excluir um usuário, este não poderá acessar o volume do Amazon Elastic File System (Amazon EFS). No entanto, um administrador ainda pode acessar os dados do volume.

Depois de excluir o usuário, adicione um novo usuário com o perfil apropriado do AWS Identity and Access Management (AWS IAM). Em seguida, tente acessar o SageMaker Studio com esse usuário.

Ao iniciar aplicações JupyterServer, você pode receber o erro "ERR_EMPTY_RESPONSE". Se você usa o navegador do Google Chrome para acessar um site e os dados não estão sendo transmitidos, talvez receba esse erro.

Para resolver o erro "ERR_EMPTY_RESPONSE" execute uma ou mais das seguintes ações:

  • Verifique se sua rede está funcionando e estável.
  • Limpe os cookies do seu navegador.
  • Use outro navegador.
  • Recrie as aplicações.

Erro da Amazon VPC

Se a Amazon Virtual Private Cloud (Amazon VPC) em que inicia o SageMaker Studio usa o Protocolo de Configuração Dinâmica de Host (DHCP), você poderá receber o seguinte erro:

"The JupyterServer app default encountered a problem and was stopped. If you continue to experience issues, please contact Customer Service.Details: InternalFailure"

Para verificar se você configurou corretamente o conjunto de opções do DHCP, conclua as seguintes etapas:

  1. Abra o console da Amazon VPC.
  2. No painel de navegação, escolha Suas VPCs.
  3. Selecione a VPC e, em seguida, Ações.
  4. Escolha Editar conjunto de opções do DHCP.
  5. Em Conjunto de opções do DHCP, escolha um conjunto já criado e, em seguida, escolha Salvar alterações.

Erro no Centro de Identidade do IAM

Se seu SageMaker Studio não estiver na mesma região da AWS que o Centro de Identidade do AWS IAM, você receberá o seguinte erro:

"You're attempting to set up Studio with SSO authentication in Europe (Frankfurt). Your AWS SSO is configured in Europe (Ireland). You must set up Studio in the same Region as AWS SSO or choose IAM authentication."

O Centro de Identidade do IAM deve ser configurado na mesma região do SageMaker Studio. Para integrar seu domínio do SageMaker AI, siga o processo de configuração personalizada para autenticação do IAM.

Observação: certifique-se de ativar o Centro de Identidade do IAM em sua conta gerencial ou em contas de membros do AWS Organizations.

Histórico de eventos do AWS CloudTrail

Se houver problemas de permissão relacionados às chamadas de API que você usa para iniciar o SageMaker Studio, a inicialização falhará.

Para identificar se há problemas de permissão, conclua as seguintes etapas:

  1. Abra o console do AWS CloudTrail.
  2. No painel de navegação, selecione Histórico de eventos.
  3. Escolha Atributos de pesquisa e, na lista suspensa, escolha Origem do evento.
  4. Selecione sagemaker.amazonaws.com.
  5. Após o carregamento dos eventos, procure os eventos CreateApp com falha que ocorreram quando você tentou iniciar o SageMaker Studio e, em seguida, escolha o evento.
  6. Leia as mensagens de erro para identificar as permissões ausentes. Por exemplo, você pode ver uma mensagem de erro semelhante a "PermissionError : User "XYZ" is not authorized to perform sagemaker:CreateApp on this resource resource_ARN".
  7. Adicione as permissões necessárias à sua identidade de usuário e, em seguida, inicie o Studio SageMaker.
AWS OFICIALAtualizada há 7 meses