Glue processing a csv

0

I am having a csv file on a s3 bucket and using a glue crawler to have a table created on Athena. The table gets created but the data gets messed up. The values gets shifted to the adjacent columns for some of the records. Is there any way to mitigate this? Does glue work fine for csv files or do the files need to be converted to a paruqet or json.

AWS
gefragt vor 4 Jahren408 Aufrufe
1 Antwort
0
Akzeptierte Antwort

Glue should work fine with CSV or any other delimited format. When you mentioned "some records", can you validate that the csv row corresponding to those records are well-formatted ? You can compare how Glue perform by using EMR Hive to create a s3-backed table.

AWS
wijayah
beantwortet vor 4 Jahren

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen