Quero conectar meu caderno do Amazon SageMaker Studio a um cluster do Amazon Redshift.
Resolução
Cluster acessível ao público
Se o cluster do Redshift estiver acessível publicamente, você poderá acessá-lo a partir de uma das seguintes opções:
- Um domínio do SageMaker executado somente com internet pública e sem acesso à Amazon Virtual Private Cloud (Amazon VPC)
- Um domínio do SageMaker Studio executado em uma Amazon VPC
Se o cluster Redshift estiver em uma VPC diferente, configure uma conexão de emparelhamento da VPC para garantir que o Studio possa acessar o cluster.
Cluster privado
Se o cluster do Redshift for privado, você poderá acessá-lo somente por meio de um domínio do SageMaker Studio executado em uma Amazon VPC. Se o cluster estiver em uma VPC diferente, configure uma conexão de emparelhamento da VPC para garantir que o Studio possa acessar o cluster.
Requisitos adicionais
Certifique-se de que os seguintes requisitos sejam atendidos para os dois tipos de clusters:
- O grupo de segurança conectado ao SageMaker Studio permite tráfego de saída para portas efêmeras. Quando um cliente Studio se conecta a um servidor Redshift, uma porta aleatória do intervalo de portas efêmeras (1024-65535) torna-se a porta de origem do cliente.
- O grupo de segurança conectado ao cluster Redshift permite a conexão de entrada do grupo de segurança vinculado ao domínio do SageMaker Studio na porta 5439.
- Se você configurou o DNS personalizado, verifique se o servidor DNS usado pela VPC do Studio pode resolver o nome do host do cluster Redshift.
Informações relacionadas
Conecte-se a uma fonte de dados externa
Usando a API de dados do Amazon Redshift para interagir a partir de um caderno Amazon SageMaker Jupyter
Leia a documentação do Docs para Ingerir dados com o Redshift