Publié le: May 27, 2021
AWS Glue DataBrew prend désormais en charge les transformations de type imbriquer et désimbriquer pour aider les utilisateurs à compacter ou décompacter les données dans des colonnes afin de manipuler leurs ensembles de données. Grâce à ces transformations, les utilisateurs peuvent désormais facilement extraire des données de champs de chaînes json imbriqués ou combiner des données sans écrire de code.
Pour imbriquer des données, les utilisateurs peuvent choisir dans une liste de colonnes sources et les compacter dans un format struct, map ou array. Pour désimbriquer des données, les utilisateurs peuvent décompacter les données imbriquées à partir d'un array, d'un map, d'un struct ou d'une colonne de chaîne pour créer de nouvelles lignes ou colonnes. Les utilisateurs peuvent appliquer des opérations de désimbrication sur plusieurs niveaux de données json d'entrée. En outre, les utilisateurs peuvent également extraire les clés/valeurs des colonnes de chaînes imbriquées pour créer des colonnes distinctes et transformer les colonnes de chaînes json existantes en colonnes de type array ou struct. Pour en savoir plus sur les transformations de structures de données, cliquez ici.
AWS Glue DataBrew est un outil visuel de préparation des données qui permet de nettoyer et de normaliser facilement les données à l'aide de plus de 250 transformations prédéfinies pour la préparation des données, sans qu'il soit nécessaire d'écrire le moindre code.
Pour démarrer, visitez la Console de gestion AWS ou installez le module d'extension DataBrew dans votre environnement de bloc-notes et consultez la documentation DataBrew sur toutes les transformations disponibles.