Talend 到 Glue 的迁移

0

【以下的问题经过翻译处理】 客户使用 Talend 进行 ETL,使用 Postgres 进行 DWH。他们希望将 ETL 工作负载迁移到 Glue ETL,将 DWH 放在 Redshift 上。他们想知道如何在AWS Glue中实现以下场景:

  1. 在 Glue 作业中从 MS Excel 中提取数据进行进一步处理。
  2. 从 SharePoint 中提取数据。目前,他们在 SharePoint 和 Talend 之间使用Apigee。
  3. 数据血缘
  4. 当作业完成或失败时,向管理员发送已处理/已拒绝的作业数量的电子邮件。

请提供关于如何在 Glue 中实现上述场景的信息。任何关于 Talend 到 Glue 迁移相关的参考信息都将非常有帮助。谢谢。

profile picture
전문가
질문됨 5달 전28회 조회
1개 답변
0

【以下的回答经过翻译处理】 这似乎是一个相对轻量级的使用情况,在这种情况下,这可以在纯 Python 库和 Python Glue Shell 实现。

  1. 使用 Python 的 Excel 库从 Excel 文件中提取/处理数据。
  2. 使用 Python 的 REST API 提取 Sharepoint 数据。
  3. 添加列以跟踪数据源的数据传承。
  4. 在处理后获取处理计数并将数据通过 SNS 发送。
profile picture
전문가
답변함 5달 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인