Publié le: Jul 26, 2019
À compter d’aujourd’hui, vous pouvez conserver des signets de tâches pour les formats Parquet et ORC dans les tâches Glue ETL (avec la version 1.0 de Glue). AWS Glue suit les données traitées lors d’une précédente exécution de tâche ETL en stockant les informations d’état de l’exécution de la tâche. Ces informations d’état persistantes sont baptisées signets de tâche. Les signets de tâche permettent à AWS Glue de conserver des informations d’état et éviter le retraitement d’anciennes données.
Auparavant, vous ne pouviez marquer que les formats de source S3 comme JSON, CSV, Apache Avro et XML.
Cette fonctionnalité est disponible dans toutes les régions où AWS Glue est disponible, à l'exception d'AWS GovCloud (USA Est) et AWS GovCloud (USA Ouest).
Pour en savoir plus sur cette fonctionnalité, consultez notre documentation.