Publié le: Nov 2, 2023

Vous pouvez désormais lancer Amazon SageMaker Data Wrangler depuis Amazon EMR Studio pour préparer des données avec peu de code pour le machine learning (ML). Amazon EMR est la solution de Big Data dans le cloud pour le traitement de données à l'échelle du pétaoctet, l'analyse interactive et le machine learning à l'aide de frameworks open source tels qu'Apache Spark, Apache Hive et Presto. Amazon SageMaker Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning (ML) de plusieurs semaines à quelques minutes. La nouvelle intégration fournit une expérience simplifiée pour lancer SageMaker Data Wrangler depuis EMR Studio afin de préparer les données pour le ML sans écrire de code.

L'analyse, la transformation et la préparation de grandes quantités de données constituent une partie essentielle et également la plus chronophage du flux de travail de machine learning. À compter d'aujourd'hui, les clients peuvent lancer SageMaker Data Wrangler depuis EMR Studio pour découvrir les clusters EMR existants et s'y connecter. Ils peuvent ensuite utiliser l'interface visuelle Data Wrangler pour analyser les données à l'aide du rapport Data Quality and Insights, nettoyer les données et créer des fonctionnalités pour le ML à l'aide de plus de 300 transformations soutenues par Spark. Ils peuvent évoluer pour traiter de très grands ensembles de données avec des tâches de traitement distribuées, automatiser la préparation des données à l'aide de la fonctionnalité de planification intégrée ou s'intégrer à SageMaker Pipeline pour une formation de bout en bout ou un flux de travail d'inférence. Ils peuvent également entraîner et déployer des modèles ML automatiquement à l'aide d'une interface visuelle avec l'intégration de SageMaker Autopilot à partir de SageMaker Data Wrangler. 

La nouvelle intégration est disponible dans toutes les régions commerciales où EMR et SageMaker Data Wrangler sont disponibles. Pour plus d'informations, consultez la documentation technique AWS.