AWS Glue可以读取使用Windows 1252编码的带扩展字符的csv文件。

0

【以下的问题经过翻译处理】 是否有选项可以启用Dynamicframe Reader在cp1252字符集(Windows Latin扩展字符集)中打开编码的文件?

profile picture
EXPERTE
gefragt vor 5 Monaten8 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 目前,您需要使用spark.read读取文件,然后转换为DynamicFrame,参见下面的示例:

df_1252_all = spark.read.option("header", "true").option("charset", "cp1252").csv("s3a://My-BUCKET/cp1252_all.csv") dyn_all= DynamicFrame.fromDF(df_1252_all, glueContext, "dyn_all")

profile picture
EXPERTE
beantwortet vor 5 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen