AWS Glue gives error: "An error occurred while calling o285.save. File already exists:"

0

I'm testing a relatively simple pyspark script that I first wrote (and tested) EMR. On the EMR script works as intended, but in Glue, the script starts writing output to desired S3 location and stops midway with this error:

An error occurred while calling o285.save. File already exists:s3://bucket/prefix/part-xxxx.json

Syntax I'm using to write DF:

df \
.write.format('json') \
.option('header', 'false') \
.save('s3://...')

The prefix didn't exist on S3 before running the script. I'd appreciate any and all help on how to get this fixed.

feita há 2 anos165 visualizações
Sem respostas

Você não está conectado. Fazer login para postar uma resposta.

Uma boa resposta responde claramente à pergunta, dá feedback construtivo e incentiva o crescimento profissional de quem perguntou.

Diretrizes para responder a perguntas