Amazon SageMaker Canvas prend désormais en charge l'importation de flux de données et une préparation plus rapide des données pour le machine learning
Amazon SageMaker Data Wrangler dans Amazon SageMaker Canvas prend désormais en charge l'importation de flux de données depuis Amazon SageMaker Studio Classic, ainsi qu'une préparation des données plus rapide et flexible pour le machine learning (ML). Avec la dernière version de SageMaker Data Wrangler dans SageMaker Canvas, vous pouvez désormais importer plus facilement des données depuis S3 grâce à des délimiteurs personnalisés et davantage d'options d'échantillonnage, et préparer des données avec des performances améliorées. En outre, vous pouvez valider les transformations plus rapidement et effectuer facilement des itérations sur les recettes de données. Vous pouvez également importer des flux de données depuis SageMaker Studio Classic pour tirer parti des dernières fonctionnalités de préparation des données et des améliorations de SageMaker Canvas.
L'agrégation, l'analyse et la transformation de grandes quantités de données constituent la partie la plus longue d'un projet de machine learning, car il s'agit d'un processus hautement itératif et répétitif. Grâce à ces nouvelles améliorations, vous pouvez importer des données avec différentes méthodes d'échantillonnage, telles que top-k, aléatoire ou stratifié, et ajuster la taille de l'échantillon ainsi que la méthode selon les besoins pour obtenir un échantillon représentatif. Vous pouvez transformer les données avec une latence plus faible, valider rapidement l'impact des transformations sur la taille des données et réorganiser les étapes selon les besoins. En outre, vous pouvez copier une recette de données et remplacer les sources de données pour la réutiliser pour différents jeux de données et modèles. Enfin, vous pouvez importer en un clic tous les flux de données existants depuis SageMaker Data Wrangler dans SageMaker Studio Classic vers SageMaker Canvas, ou importer manuellement des flux de données spécifiques via S3 ou des téléchargements de fichiers locaux.
Ces améliorations apportées à la préparation des données sont disponibles dans toutes les régions AWS où SageMaker Canvas est pris en charge. Pour en savoir plus, consultez le blog et la documentation technique AWS.