Warum verarbeitet mein AWS Glue ETL-Job Daten erneut, obwohl Job-Lesezeichen aktiviert sind?

Lesedauer: 1 Minute
0

Ich habe Job-Lesezeichen für meinen AWS Glue-Auftrag aktiviert, aber der Job verarbeitet die Daten immer noch neu.

Behebung

Im Folgenden werden einige häufige Gründe genannt, warum ein ETL-Job (Extrahieren, Transformieren und Laden) Daten erneut verarbeiten kann, obwohl Job-Lesezeichen aktiviert sind:

  • Sie haben mehrere gleichzeitige Jobs mit Job-Lesezeichen, und die maximale Gleichzeitigkeit ist nicht auf 1 gesetzt.
  • Das Objekt job.init() fehlt.
  • Das Objekt job.commit() fehlt.
  • Der Parameter transformation_ctx fehlt.
  • Die Primärschlüssel der Tabelle sind nicht in sequentieller Reihenfolge (nur JDBC-Verbindungen).
  • Die Quelldaten wurden nach Ihrem letzten Joblauf geändert.

Weitere Informationen zu jedem dieser Probleme finden Sie unter Fehler: Ein Job verarbeitet Daten erneut, wenn Job-Lesezeichen aktiviert sind.


Verwandte Information

Verfolgung der verarbeiteter Daten mithilfe von Job-Bookmarks

AWS OFFICIAL
AWS OFFICIALAktualisiert vor 2 Jahren