Publié le: Mar 31, 2023

AWS Glue Studio propose désormais 10 nouvelles transformations visuelles : concaténer, diviser une chaîne, un tableau en colonnes, ajouter un horodatage actuel, faire pivoter des lignes vers des colonnes, dissocier des colonnes vers des lignes, rechercher, exploser, colonne dérivée et traitement d'équilibrage automatique. AWS Glue Studio propose une interface visuelle d'extraction, de transformation et de chargement (ETL) permettant de créer, d'exécuter et de surveiller les tâches ETL AWS Glue. Grâce à ces nouveaux composants, les développeurs ETL peuvent rapidement créer des pipelines de données plus sophistiqués sans avoir à écrire de code.

Ces 10 nouvelles transformations répondent à divers besoins en matière de traitement des données : fusionnez des colonnes avec Concatenate ou séparez une chaîne à l'aide d'un délimiteur avec Split String. L'ajout d'un horodatage actuel vous permet d'enregistrer la date à laquelle vos données ont été traitées. Faire pivoter des lignes vers des colonnes et défaire pivoter des colonnes vers des lignes permettent de restructurer les données en vue de leur agrégation. Lookup est un moyen simple d'ajouter des colonnes d'une autre table dans le jeu de données. La colonne dérivée vous permet de définir une nouvelle colonne en fonction d'autres colonnes à l'aide d'expressions mathématiques ou SQL. Explode décompresse les structures de données imbriquées et, enfin, le traitement Autobalance est une fonctionnalité avancée qui améliore les performances professionnelles lorsque les données ne sont pas bien réparties entre les travailleurs. Toutes ces nouvelles transformations sont disponibles à la fois dans les tâches visuelles et basées sur le code.

Ces nouveaux composants sont disponibles dans les mêmes régions AWS qu'AWS Glue.

Pour en savoir plus, consultez la documentation AWS Glue.