AWS AthenaはUTF-16に対応していますか?

0

S3に格納したCSVデータ(UTF-16 LE)をAthenaを使って読み込みましたが、ダブルクオーテーションが消えない、文字化けするなどで正常に読み込めません。 同じデータをUTF-8に変換してからS3にアップロードしたところ、正常に読み込めました。 AthenaはUTF-16には対応していないのでしょうか?

machi
질문됨 일 년 전466회 조회
1개 답변
0

こちらAthenaに読み込ませる前に、Glueを使ってCSVデータから対象のテーブルを作成しておりますでしょうか。

Glueを利用していた場合は、以下の記事に、「特に文字コードの規定があるわけではありませんが、PySparkをベースにしているため、ジョブ処理時には文字列がUTF-8である事を想定しています。」と記載があります。

https://aws.typepad.com/sajp/2017/12/aws-black-belt-onine-seminar-aws-glue.html

ご参考にしてください。

profile picture
답변함 10달 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인