AWS Glue可以读取使用Windows 1252编码的带扩展字符的csv文件。

0

【以下的问题经过翻译处理】 是否有选项可以启用Dynamicframe Reader在cp1252字符集(Windows Latin扩展字符集)中打开编码的文件?

profile picture
专家
已提问 5 个月前6 查看次数
1 回答
0

【以下的回答经过翻译处理】 目前,您需要使用spark.read读取文件,然后转换为DynamicFrame,参见下面的示例:

df_1252_all = spark.read.option("header", "true").option("charset", "cp1252").csv("s3a://My-BUCKET/cp1252_all.csv") dyn_all= DynamicFrame.fromDF(df_1252_all, glueContext, "dyn_all")

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则