Publicado en: Oct 22, 2019
Desde hoy, puede rebobinar sus marcadores de trabajo para sus trabajos de Glue Spark ETL a cualquier ejecución de trabajo anterior. AWS Glue realiza el seguimiento de los datos que han sido procesados durante la ejecución anterior de un trabajo de ETL, y almacena la información de estado a partir de la ejecución del trabajo. Esta información de estado persistente se denomina marcador de trabajo.
Antes, usted solo podía restablecer sus marcadores de trabajo, lo que resultaba en la ejecución posterior del trabajo reprocesando todos los datos procesados por ejecuciones de trabajos anteriores. Ahora, puede admitir escenarios de reposición de datos mejor al rebobinar sus marcadores de trabajo a cualquier ejecución de trabajo anterior reprocesando los datos solo desde la ejecución del trabajo marcado.
Esta característica se encuentra disponible en todas las regiones de AWS en las que se ofrece AWS Glue, excepto AWS GovCloud (EE. UU. Este) y AWS GovCloud (EE. UU.).
Para obtener más información acerca de esta característica, consulte nuestra documentación.