Publié le: Aug 29, 2022
Amazon SageMaker Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning (ML) de quelques semaines à quelques minutes dans Amazon SageMaker Studio, le premier environnement de développement entièrement intégré (IDE) pour le ML. SageMaker Data Wrangler vous permet de simplifier le processus de préparation des données et d'ingénierie des fonctionnalités, mais également d'effectuer toutes les étapes du flux de préparation de données telles que la sélection, le nettoyage, l'exploration et la visualisation des données depuis une seule interface visuelle. Les clients qui utilisent Data Wrangler peuvent importer des données depuis Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks Lakehouse Platform et bientôt d'autres plateformes.
Dès aujourd'hui, les nouveaux clients de Data Wrangler pourront démarrer plus rapidement sur Data Wrangler à l'aide d'exemples de jeux de données et en suivant des étapes guidées pour parcourir le produit pour la première fois. Data Wrangler offre des jeux de données Titanic au public. Ils sont largement utilisés pour apprendre et expérimenter avec ML. Ainsi, le client n'a plus besoin d'importer ses propres données pour commencer. Data Wrangler suggère désormais des actions afin d'aider les personnes qui l'utilisent pour la première fois à découvrir des fonctionnalités, comme Data Quality and Insights report (Rapport sur la qualité des données et les aperçus), une fonctionnalité populaire qui évalue la qualité des données et y détecte les anomalies.
Pour en savoir plus sur le démarrage avec Amazon SageMaker Data Wrangler, consultez le blog ou la documentation AWS.