如何在Glue Job 中调用存储过程

0

【以下的问题经过翻译处理】 团队您好,

我希望在glue job结束时(在gluejob内部),调用我的存储过程,

能否在不使用py4j的情况下,从pyspark glue Job 连接 mySQL RDS数据库并调用存储过程?

我在网上没有找到相关示例(其中一个讨论了使用py4j:https://stackoverflow.com/questions/64775753/how-to-run-arbitrary-ddl-sql-statements-or-stored-procedures-using-aws-glue

任何代码示例都将非常有帮助。 非常感谢。

profile picture
專家
已提問 5 個月前檢視次數 21 次
1 個回答
0

【以下的回答经过翻译处理】 我使用Pymysql 实现这个功能。这是我使用的代码示例:

import sys
import pymysql

........

rds_host  = "database-id.rds.amazonaws.com"
name = "userName"
password = "secretPassword"
db_name = "myDb"
conn = pymysql.connect(host=rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)

with conn.cursor() as cur:
   query="CALL mystoredProcedure()"
   cur.execute(query)
   conn.commit()
   cur.close()

profile picture
專家
已回答 5 個月前

您尚未登入。 登入 去張貼答案。

一個好的回答可以清楚地回答問題並提供建設性的意見回饋,同時有助於提問者的專業成長。

回答問題指南