如何在Glue Job 中调用存储过程

0

【以下的问题经过翻译处理】 团队您好,

我希望在glue job结束时(在gluejob内部),调用我的存储过程,

能否在不使用py4j的情况下,从pyspark glue Job 连接 mySQL RDS数据库并调用存储过程?

我在网上没有找到相关示例(其中一个讨论了使用py4j:https://stackoverflow.com/questions/64775753/how-to-run-arbitrary-ddl-sql-statements-or-stored-procedures-using-aws-glue

任何代码示例都将非常有帮助。 非常感谢。

profile picture
专家
已提问 5 个月前18 查看次数
1 回答
0

【以下的回答经过翻译处理】 我使用Pymysql 实现这个功能。这是我使用的代码示例:

import sys
import pymysql

........

rds_host  = "database-id.rds.amazonaws.com"
name = "userName"
password = "secretPassword"
db_name = "myDb"
conn = pymysql.connect(host=rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)

with conn.cursor() as cur:
   query="CALL mystoredProcedure()"
   cur.execute(query)
   conn.commit()
   cur.close()

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则