AWS AthenaはUTF-16に対応していますか?

0

S3に格納したCSVデータ(UTF-16 LE)をAthenaを使って読み込みましたが、ダブルクオーテーションが消えない、文字化けするなどで正常に読み込めません。 同じデータをUTF-8に変換してからS3にアップロードしたところ、正常に読み込めました。 AthenaはUTF-16には対応していないのでしょうか?

machi
gefragt vor einem Jahr483 Aufrufe
1 Antwort
0

こちらAthenaに読み込ませる前に、Glueを使ってCSVデータから対象のテーブルを作成しておりますでしょうか。

Glueを利用していた場合は、以下の記事に、「特に文字コードの規定があるわけではありませんが、PySparkをベースにしているため、ジョブ処理時には文字列がUTF-8である事を想定しています。」と記載があります。

https://aws.typepad.com/sajp/2017/12/aws-black-belt-onine-seminar-aws-glue.html

ご参考にしてください。

profile picture
beantwortet vor einem Jahr

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen