Publicado en: Jul 26, 2019
A partir de hoy, puede mantener los marcadores del trabajo para formatos Parquet y ORC en los trabajos de ETL de AWS Glue (Glue, versión 1.0). AWS Glue realiza el seguimiento de los datos que han sido procesados durante la ejecución anterior de un trabajo de ETL, y almacena la información de estado a partir de la ejecución del trabajo. Esta información de estado persistente se denomina marcador de trabajo. Los marcadores de trabajo ayudan a AWS Glue a mantener la información de estado y evitar el reprocesamiento de datos antiguos.
Anteriormente, solo podía marcar formatos de origen común de S3, tales como JSON, CSV, Apache Avro y XML.
Esta característica se encuentra disponible en todas las regiones en las que se ofrece AWS Glue, excepto AWS GovCloud (EE.UU. Este) y AWS GovCloud (EE.UU.).
Para obtener más información acerca de esta característica, consulte nuestra documentación.