Publié le: Aug 16, 2023

AWS Glue Studio propose désormais cinq nouvelles transformations visuelles : correspondance d'archive, suppression des lignes nulles, extraction de fragments de chaîne d'une expression régulière, analyse de la colonne JSON et extraction du chemin JSON. AWS Glue Studio propose une interface visuelle d'extraction, de transformation et de chargement (ETL) permettant de créer, d'exécuter et de surveiller les tâches ETL AWS Glue. Grâce à ces nouveaux composants, les développeurs ETL peuvent rapidement créer des pipelines de données plus sophistiqués sans avoir à écrire de code.

Chacune de ces cinq nouvelles transformations répond à un besoin unique de traitement des données : utilisez Remove null rows (Supprimer les lignes nulles) pour réduire le nombre de lignes et ne conserver que celles contenant des données, sélectionnez Extract string fragments from a regular expression (Extraire les fragments de chaîne d'une expression régulière) pour extraire les parties pertinentes d'une chaîne et sélectionner les informations pertinentes, utilisez vos modèles ML Glue avec Record matching (Correspondance d'archive) pour identifier d'autres doublons potentiels dans votre jeu de données, transformez les chaînes JSON avec Parse JSON column (Analyser la colonne JSON) qui vous permet de convertir une chaîne JSON en structure de données ou un tableau, ou extrayez simplement le chemin JSON dont vous avez besoin avec Extract JSON path (Extraire le chemin JSON). Les nouvelles transformations sont disponibles à la fois dans les tâches visuelles et basées sur le code.

Cette nouvelle fonctionnalité est désormais disponible dans toutes les régions commerciales AWS où AWS Glue est disponible. Consultez la liste des services régionaux AWS pour obtenir les dernières informations sur la disponibilité

Pour en savoir plus, consultez la documentation AWS Glue.