Inserito il: Jul 26, 2019
A partire da oggi, è possibile conservare segnalibri di processo per i formati Parquet e ORC nelle operazioni ETL di Glue (usandone la versione 1.0). AWS Glue tiene traccia dei dati elaborati durante la precedente esecuzione di un processo ETL memorizzandone le informazioni sulo stato di esecuzione. Queste informazioni sullo stato di conservazione sono definite “segnalibri di processo”. I segnalibri di processo permettono ad AWS Glue di conservare le informazioni sullo stato e impedire la rielaborazione di vecchi dati.
In precedenza, era possibile contrassegnare solo i formati S3 più comuni come JSON, CSV, Apache Avro e XML.
Questa funzione è disponibile in tutte le regioni in cui sia offerto AWS Glue, ad eccezione di AWS GovCloud (Stati Uniti-orientali) e AWS GovCloud (Stati Uniti occidentali).
Per ulteriori informazioni su questa caratteristica, consulta la relativa documentazione.