Publié le: May 1, 2023

Amazon SageMaker Data Wrangler réduit de plusieurs semaines à quelques minutes le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning (ML). SageMaker Data Wrangler vous permet également de simplifier le processus de préparation des données et d'ingénierie des fonctionnalités, mais aussi d'effectuer toutes les étapes du flux de travail de préparation de données telles que la sélection, le nettoyage, l'exploration et le traitement des données depuis une seule interface visuelle.

À compter d'aujourd'hui, vous pouvez utiliser les nouvelles fonctionnalités d'Amazon SageMaker Data Wrangler pour préparer des données d'image à des fins d'étiquetage, d'apprentissage ou d'inférence. Vous pouvez prévisualiser et importer des images depuis Amazon S3, utiliser diverses transformations d'image intégrées pour nettoyer, standardiser et améliorer la qualité de vos données d'image. Ces transformations intégrées incluent le redimensionnement, la suppression des doublons, la rotation, le retournement, les niveaux de gris, l'amélioration du contraste, le flou et l'ajout de bruit, etc. Data Wrangler prend également en charge des cas d'utilisation avancés tels que la détection de valeurs aberrantes ou l'extraction de textes à partir d'images à l'aide d'un code personnalisé et d'extraits de code intégrés. Ces extraits de code incluent des exemples d'utilisation d'un modèle préentraîné à l'aide d'Amazon Sagemaker Jumpstart pour effectuer des analyses ou des transformations avancées en appelant un point de terminaison de modèle prédéployé. Après avoir créé une recette à partir des données d'image échantillonnées en mode interactif, vous pouvez créer une tâche PySpark via l'interface visuelle pour adapter le traitement à toutes les images de votre jeu de données.  

Data Wrangler prend en charge la préparation de données d'image dans toutes les régions actuellement prises en charge par Data Wrangler. Pour en savoir plus, consultez cet article de blog et la documentation technique AWS.