Perché il processo AWS Glue ETL continua a rielaborare i dati anche quando i segnalibri sono abilitati?

1 minuti di lettura
0

Ho attivato i segnalibri del processo AWS Glue, ma il processo continua a rielaborare i dati.

Risoluzione

Ecco alcuni motivi comuni per cui un processo di estrazione, trasformazione e caricamento (ETL) potrebbe rielaborare i dati anche se i segnalibri del processo sono abilitati:

  • Stai eseguendo più processi simultaneamente con segnalibri del processo e il numero massimo di simultaneità non è impostato su 1.
  • L'oggetto job.init() è mancante.
  • L'oggetto job.commit() è mancante.
  • Il parametro transformation_ctx è mancante.
  • Le chiavi primarie della tabella non sono in ordine sequenziale (solo connessioni JDBC).
  • I dati di origine sono stati modificati dopo l'ultima esecuzione del processo.

Per ulteriori informazioni su ciascuno di questi problemi, consulta Error: A job is reprocessing data when job bookmarks are enabled.


Informazioni correlate

Tracking processed data using job bookmarks

AWS UFFICIALE
AWS UFFICIALEAggiornata un anno fa