如何在Glue Job 中调用存储过程

0

【以下的问题经过翻译处理】 团队您好,

我希望在glue job结束时(在gluejob内部),调用我的存储过程,

能否在不使用py4j的情况下,从pyspark glue Job 连接 mySQL RDS数据库并调用存储过程?

我在网上没有找到相关示例(其中一个讨论了使用py4j:https://stackoverflow.com/questions/64775753/how-to-run-arbitrary-ddl-sql-statements-or-stored-procedures-using-aws-glue

任何代码示例都将非常有帮助。 非常感谢。

1 Risposta
0

【以下的回答经过翻译处理】 我使用Pymysql 实现这个功能。这是我使用的代码示例:

import sys
import pymysql

........

rds_host  = "database-id.rds.amazonaws.com"
name = "userName"
password = "secretPassword"
db_name = "myDb"
conn = pymysql.connect(host=rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)

with conn.cursor() as cur:
   query="CALL mystoredProcedure()"
   cur.execute(query)
   conn.commit()
   cur.close()

profile picture
ESPERTO
con risposta 5 mesi fa

Accesso non effettuato. Accedi per postare una risposta.

Una buona risposta soddisfa chiaramente la domanda, fornisce un feedback costruttivo e incoraggia la crescita professionale del richiedente.

Linee guida per rispondere alle domande