Publié le: Jul 23, 2021

AWS Glue DataBrew permet désormais aux clients de spécifier les statistiques de qualité de données à générer automatiquement pour les jeux de données lors de l'exécution d'une tâche de profil. Cela permet aux utilisateurs de personnaliser les statistiques de profil de données telles que la détermination des valeurs en double, des corrélations et des valeurs aberrantes en fonction de la nature et de la taille de leurs jeux de données, et de créer un aperçu personnalisé du profil de données avec uniquement les statistiques qui répondent à leurs besoins.

DataBrew présente toutes les statistiques d'une tâche de profil sur un tableau de bord de profil visuel et stocke les données brutes sous forme d'objet JSON dans un compartiment Amazon S3. Les clients peuvent contrôler les statistiques à afficher, surveiller la qualité des données entrantes au fil du temps et découvrir les modifications apportées aux données en quelques minutes, le tout sans écrire le moindre code. Les clients peuvent également configurer des alertes automatisées sur la qualité des données à l'aide de DataBrew et AWS Lambda, comme indiqué dans cet article de blog.

Pour démarrer, consultez la console de gestion AWS ou installez le plugin DataBrew dans votre environnement de bloc-notes et reportez-vous à la documentation DataBrew.