Publié le: Mar 9, 2021
Lorsque vous générez des profils de qualité de données sur vos jeux de données, DataBrew publie désormais un tableau de bord visuel sur la console AWS Glue DataBrew avec plus de 40 statistiques et visualisations listées dans un format tabulaire pour faciliter la comparaison. La compréhension de la qualité des données est la clé du succès de vos projets analytiques et de machine learning. Grâce à cette nouvelle fonctionnalité de DataBrew, il est facile de repérer les anomalies dans les distributions de données, de détecter les valeurs aberrantes, de comprendre les biais, et bien davantage pour des jeux de données allant de quelques milliers de lignes à des dizaines de millions de lignes et de différents formats de fichiers.
AWS Glue DataBrew est un outil visuel de préparation des données qui permet de nettoyer et de normaliser facilement les données à l'aide de plus de 250 transformations prédéfinies pour la préparation des données, sans qu'il soit nécessaire d'écrire le moindre code.
Pour démarrer, visitez la Console de gestion AWS ou installez le module d'extension DataBrew dans votre environnement de bloc-notes et reportez-vous à la documentation de DataBrew.