如何在Glue Job 中调用存储过程

0

【以下的问题经过翻译处理】 团队您好,

我希望在glue job结束时(在gluejob内部),调用我的存储过程,

能否在不使用py4j的情况下,从pyspark glue Job 连接 mySQL RDS数据库并调用存储过程?

我在网上没有找到相关示例(其中一个讨论了使用py4j:https://stackoverflow.com/questions/64775753/how-to-run-arbitrary-ddl-sql-statements-or-stored-procedures-using-aws-glue

任何代码示例都将非常有帮助。 非常感谢。

1 réponse
0

【以下的回答经过翻译处理】 我使用Pymysql 实现这个功能。这是我使用的代码示例:

import sys
import pymysql

........

rds_host  = "database-id.rds.amazonaws.com"
name = "userName"
password = "secretPassword"
db_name = "myDb"
conn = pymysql.connect(host=rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)

with conn.cursor() as cur:
   query="CALL mystoredProcedure()"
   cur.execute(query)
   conn.commit()
   cur.close()

profile picture
EXPERT
répondu il y a 5 mois

Vous n'êtes pas connecté. Se connecter pour publier une réponse.

Une bonne réponse répond clairement à la question, contient des commentaires constructifs et encourage le développement professionnel de la personne qui pose la question.

Instructions pour répondre aux questions