AWS Glue可以读取使用Windows 1252编码的带扩展字符的csv文件。

0

【以下的问题经过翻译处理】 是否有选项可以启用Dynamicframe Reader在cp1252字符集(Windows Latin扩展字符集)中打开编码的文件?

profile picture
エキスパート
質問済み 5ヶ月前9ビュー
1回答
0

【以下的回答经过翻译处理】 目前,您需要使用spark.read读取文件,然后转换为DynamicFrame,参见下面的示例:

df_1252_all = spark.read.option("header", "true").option("charset", "cp1252").csv("s3a://My-BUCKET/cp1252_all.csv") dyn_all= DynamicFrame.fromDF(df_1252_all, glueContext, "dyn_all")

profile picture
エキスパート
回答済み 5ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン

関連するコンテンツ