Publié le: Nov 18, 2021
Les utilisateurs AWS Glue DataBrew peuvent désormais créer des règles de qualité des données, qui sont des contrôles de validation personnalisables définissant des exigences métier pour des données spécifiques. Vous pouvez créer des règles pour vérifier les valeurs en double dans certaines colonnes, valider qu'une colonne ne correspond pas à une autre, ou définir de nombreux autres contrôles et conditions personnalisés basés sur vos cas d'utilisation spécifiques de la qualité des données. Vous pouvez regrouper les règles d'un jeu de données particulier dans un ensemble de règles pour plus d'efficacité et appliquer ces contrôles dans le cadre d'une tâche standard de profilage des données. Les résultats sont présentés dans un tableau de bord de qualité des données et un rapport de validation, ce qui vous permet de visualiser rapidement les résultats des règles et de déterminer si vos données peuvent être utilisées.
AWS Glue DataBrew est un outil visuel de préparation des données qui permet de nettoyer et de normaliser facilement les données à l'aide de plus de 250 transformations prédéfinies, le tout sans avoir à écrire le moindre code. Vous pouvez automatiser le filtrage des anomalies, la conversion des données en formats standard, la correction des valeurs invalides et d'autres tâches.
Pour démarrer avec DataBrew, consultez la console de gestion AWS ou installez le plugin DataBrew dans votre environnement de bloc-notes. Pour en savoir plus, regardez cette vidéo de mise en route et consultez la documentation de DataBrew.