AWS Glue是否支持固定字节长度的源数据?

0

【以下的问题经过翻译处理】 你好。

AWS Glue 能读取像下面这样的源数据文件吗?

  20220101E00011000AAABBBCCC
  20220101E00021000あいCCC

第二条记录包含日语字符,并且与第一条记录具有相同的字节长度。每条记录的字符数不同。

谢谢。

profile picture
エキスパート
質問済み 5ヶ月前16ビュー
1回答
0

【以下的回答经过翻译处理】 很遗憾,Glue目前不支持按字节解析数据。我观察到你的数据是非结构化的,唯一的解析方式是使用Grok SerDe或Regex SerDe,但它们都是通过识别模式来解析数据,所以不可行。我建议你预处理数据,然后将其加载到Glue中。预处理的过程可以使用一些自定义构建的解析器函数(如csv),然后将其存储在S3中,最后在Glue中进行爬取并创建数据库。

profile picture
エキスパート
回答済み 5ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン