AWS Glue如何正确处理CSV文件中的逗号?

0

【以下的问题经过翻译处理】 客户正在使用Glue解析CSV文件。

在尝试加载CSV文件中的一个包含有“,”(逗号)值的文本列EQUIPMENT_DESCRIPTION时遇到问题。该列的值使用文本限定符(双引号)进行标识。目前我们配置了我们的爬虫/Glue,但是无法处理该列中的逗号值。

这导致跟随EQUIPMENT_DESCRIPTION的所有其他列都填充了错误数据,包括DATE_COLLECTED列。

请问如何配置Glue以忽略这个逗号?

profile picture
エキスパート
質問済み 5ヶ月前22ビュー
1回答
0

【以下的回答经过翻译处理】 请确认表的SerDe属性中的引号字符是否被正确配置了?

请参阅 使用AWS Glue最佳实践时使用Athena 中的 使用CSV文件 章节。

profile picture
エキスパート
回答済み 5ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン