Ho attivato i segnalibri del processo AWS Glue, ma il processo continua a rielaborare i dati.
Risoluzione
Ecco alcuni motivi comuni per cui un processo di estrazione, trasformazione e caricamento (ETL) potrebbe rielaborare i dati anche se i segnalibri del processo sono abilitati:
- Stai eseguendo più processi simultaneamente con segnalibri del processo e il numero massimo di simultaneità non è impostato su 1.
- L'oggetto job.init() è mancante.
- L'oggetto job.commit() è mancante.
- Il parametro transformation_ctx è mancante.
- Le chiavi primarie della tabella non sono in ordine sequenziale (solo connessioni JDBC).
- I dati di origine sono stati modificati dopo l'ultima esecuzione del processo.
Per ulteriori informazioni su ciascuno di questi problemi, consulta Error: A job is reprocessing data when job bookmarks are enabled.
Informazioni correlate
Tracking processed data using job bookmarks