Ich habe Job-Lesezeichen für meinen AWS Glue-Auftrag aktiviert, aber der Job verarbeitet die Daten immer noch neu.
Behebung
Im Folgenden werden einige häufige Gründe genannt, warum ein ETL-Job (Extrahieren, Transformieren und Laden) Daten erneut verarbeiten kann, obwohl Job-Lesezeichen aktiviert sind:
- Sie haben mehrere gleichzeitige Jobs mit Job-Lesezeichen, und die maximale Gleichzeitigkeit ist nicht auf 1 gesetzt.
- Das Objekt job.init() fehlt.
- Das Objekt job.commit() fehlt.
- Der Parameter transformation_ctx fehlt.
- Die Primärschlüssel der Tabelle sind nicht in sequentieller Reihenfolge (nur JDBC-Verbindungen).
- Die Quelldaten wurden nach Ihrem letzten Joblauf geändert.
Weitere Informationen zu jedem dieser Probleme finden Sie unter Fehler: Ein Job verarbeitet Daten erneut, wenn Job-Lesezeichen aktiviert sind.
Verwandte Information
Verfolgung der verarbeiteter Daten mithilfe von Job-Bookmarks