我想将我的 Amazon SageMaker Studio 笔记本连接到 Amazon Redshift 集群。
解决方法
可公开访问的集群
如果 Redshift 集群可公开访问,则您可以通过以下任一方式访问该集群:
- 仅通过公共互联网启动的 SageMaker 域,不访问 Amazon Virtual Private Cloud (Amazon VPC)
- 在 Amazon VPC 中启动的 SageMaker Studio 域
如果 Redshift 集群位于一个不同的 VPC 中,则配置 VPC 对等连接以确保 Studio 可以访问该集群。
私有集群
如果 Redshift 集群是私有的,则您只能通过在 Amazon VPC 中启动的 SageMaker Studio 域访问该集群。如果该集群位于一个不同的 VPC 中,请配置 VPC 对等连接以确保 Studio 可以访问该集群。
其他要求
确保两种类型的集群都满足以下要求:
- SageMaker Studio 附属的安全组允许到临时端口的出站流量。当 Studio 客户端连接到 Redshift 服务器时,临时端口范围 (1024-65535) 中的随机端口将会成为客户端的源端口。
- Redshift 集群附属的安全组允许在 5439 端口上从 SageMaker Studio 域附属的安全组进行入站连接。
- 如果您配置了自定义 DNS,请验证 Studio VPC 使用的 DNS 服务器是否可以解析 Redshift 集群的主机名。
相关信息
连接到外部数据来源
使用 Amazon Redshift 数据 API 从 Amazon SageMaker Jupyter notebook 进行交互
阅读 Docs 文档,了解如何使用 Redshift 提取数据