Glue Studio Designer: use pyspark functions

0

I designed a glue job using Glue studio designer canvas feature and am using a custom transform in there. However, I am struggling to leverage functions like the ones from 'from pyspark.sql.functions import *' in the code as I get error "NameError: name xyz not defined.
How can I leverage these functions in the canvas tool?

  • so is it a best practice to run the imports within the function fo the custom transform?

AWS
Marco
gefragt vor 2 Jahren635 Aufrufe
2 Antworten
1

Try importing specific function instead of import *. For example, "from pyspark.sql.functions import split" to import split function.

I tried replicating your problem, it complained that import * can only be used at module level. But when I changed to specific function, it worked.

Hope this help.

AWS-TDN
beantwortet vor 2 Jahren
AWS
EXPERTE
überprüft vor 2 Jahren
0
Akzeptierte Antwort

Hi ,

yes, any library you need for your custom transform should be imported within the function.

just to consider if you want to run SparkSQL you could also use the SQL transform.

hope this helps,

AWS
EXPERTE
beantwortet vor 2 Jahren

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen