如何在Glue Job 中调用存储过程

0

【以下的问题经过翻译处理】 团队您好,

我希望在glue job结束时(在gluejob内部),调用我的存储过程,

能否在不使用py4j的情况下,从pyspark glue Job 连接 mySQL RDS数据库并调用存储过程?

我在网上没有找到相关示例(其中一个讨论了使用py4j:https://stackoverflow.com/questions/64775753/how-to-run-arbitrary-ddl-sql-statements-or-stored-procedures-using-aws-glue

任何代码示例都将非常有帮助。 非常感谢。

1 Antwort
0

【以下的回答经过翻译处理】 我使用Pymysql 实现这个功能。这是我使用的代码示例:

import sys
import pymysql

........

rds_host  = "database-id.rds.amazonaws.com"
name = "userName"
password = "secretPassword"
db_name = "myDb"
conn = pymysql.connect(host=rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)

with conn.cursor() as cur:
   query="CALL mystoredProcedure()"
   cur.execute(query)
   conn.commit()
   cur.close()

profile picture
EXPERTE
beantwortet vor 5 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen