Publié le: Dec 14, 2022

Aujourd'hui, nous sommes ravis d'annoncer le lancement des visualisations au niveau des fonctionnalités générées automatiquement dans Amazon SageMaker Data Wrangler. Amazon SageMaker Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning (ML) de plusieurs semaines à quelques minutes. Data Wrangler vous permet de simplifier le processus de préparation des données et d'ingénierie des fonctionnalités, mais également d'effectuer toutes les étapes du flux de préparation de données telles que la sélection, le nettoyage, l'exploration et la visualisation des données depuis une seule interface visuelle. Data Wrangler propose diverses options de visualisation configurables, qu'il s'agisse de visualisations de données générales telles qu'un histogramme, un nuage de points ou un tableau récapitulatif, ou de visualisations avancées telles que la détection des anomalies ou la décomposition des tendances saisonnières pour les données de séries chronologiques, les fuites de données et les biais liés aux fonctionnalités pour les besoins de machine learning. 

À compter d'aujourd'hui, SageMaker Data Wrangler génère automatiquement des visualisations pour chaque entité du jeu de données. Vous verrez ces visualisations en haut de chaque colonne du jeu de données une fois celui-ci importé. Cette automatisation réduit davantage les lourdes tâches quotidiennes des scientifiques des données en générant automatiquement des informations relatives à la distribution des données et à la qualité des données au niveau des fonctionnalités. 

Grâce aux visualisations générées automatiquement, vous pouvez obtenir immédiatement des informations relatives à la distribution et aux types de données sans avoir à écrire une seule ligne de code. Les informations vous aident à détecter facilement les problèmes de qualité des données tels que les valeurs aberrantes, manquantes ou non valides, et autres, pour chaque colonne de jeu de données. De plus, vous pouvez également survoler les visualisations avec votre souris pour afficher des statistiques détaillées telles que le nombre et le pourcentage.  

Cette fonctionnalité est généralement disponible et automatiquement activée dans toutes les régions AWS actuellement prises en charge par Data Wrangler sans coût supplémentaire. Pour en savoir plus, consultez l'AWS News Blog et la documentation produit Data Wrangler.