Publié le: Aug 21, 2023

Amazon SageMaker Data Wrangler prend désormais en charge les points d'accès S3 pour prévisualiser et importer des données dans SageMaker Data Wrangler et en tant que destination pour les données exportées depuis SageMaker Data Wrangler. La préparation de données de haute qualité pour le ML est souvent complexe et prend du temps, car elle nécessite l'agrégation de données provenant de sources et de formats divers et utilisant différents outils. Avec SageMaker Data Wrangler, vous pouvez explorer et importer des données provenant de diverses sources populaires comme Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks et plus de 40 sources de données SaaS. Les clients utilisent de plus en plus Amazon S3 pour stocker des jeux de données partagés, dans lesquels les données sont globalisées et accessibles par plusieurs applications, équipes et personnes. Les points d'accès S3 permettent aux entreprises d'octroyer un contrôle d'accès précis à un niveau granulaire. Au lieu de modifier une politique de compartiment unique, les entreprises peuvent créer plusieurs points d'accès avec des politiques individuelles adaptées à des cas d'utilisation spécifiques, réduisant ainsi le risque de mauvaise configuration ou d'accès involontaire à des données sensibles. À compter d'aujourd'hui, SageMaker Data Wrangler permet aux clients de préparer plus facilement les données à partir de jeux de données partagés stockés dans S3, tout en permettant aux entreprises de contrôler en toute sécurité l'accès aux données. 

Une fois les données importées, vous pouvez rapidement comprendre la qualité des données, les nettoyer et créer des fonctions grâce à plus de 300 analyses et transformations de données intégrées. Vous pouvez également former et déployer des modèles avec SageMaker Autopilot, et rendre opérationnel le processus de préparation des données dans un pipeline d'ingénierie des fonctionnalités, de formation ou de déploiement en utilisant l'intégration avec SageMaker Pipeline depuis SageMaker Data Wrangler.

SageMaker Data Wrangler prend en charge les points d'accès Amazon S3 dans toutes les régions actuellement prises en charge par Data Wrangler. Pour en savoir plus, consultez la documentation technique AWS.