Publié le: Jun 8, 2021
Avec Amazon SageMaker Data Wrangler, regrouper et préparer des données pour le Machine Learning (ML) ne prend plus des semaines mais seulement quelques minutes. SageMaker Data Wrangler vous permet également de simplifier le processus de préparation des données et d'ingénierie des fonctionnalités mais aussi d'effectuer toutes les étapes du flux de travail de préparation de données telles que la sélection, le nettoyage, l'exploration et la visualisation des données depuis une seule interface visuelle. À compter d'aujourd'hui, vous pouvez utiliser Snowflake comme source de données dans Amazon SageMaker Data Wrangler afin de préparer aisément des données dans Snowflake pour le Machine Learning.
Avec Snowflake utilisé comme source de données pour Amazon SageMaker Data Wrangler, vous pouvez désormais vous connecter rapidement et aisément à Snowflake sans écrire une seule ligne de code. Vous pouvez également ajouter vos données stockées dans Snowflake aux données stockées dans Amazon S3, ainsi que les données interrogées depuis Amazon Athena et Amazon Redshift afin de préparer les données pour le Machine Learning. Une fois connecté, vous pouvez interroger des données stockées dans Snowflake de façon interactive, transformer aisément des données à l'aide de plus de 300 transformations de données préconfigurées, comprendre les données et identifier des erreurs potentielles ainsi que des valeurs extrêmes à l'aide d'un ensemble de modèles de visualisation robustes préconfigurés. Vous pouvez aussi rapidement identifier les incohérences dans votre flux de travail de préparation de données et diagnostiquer les problèmes avant que les modèles soient déployés pour la production. Enfin, vous pouvez exporter votre flux de travail de préparation des données vers Amazon S3 afin de pouvoir l'utiliser avec d'autres fonctionnalités SageMaker, telles que Amazon SageMaker Autopilot, Amazon SageMaker Feature Store et Amazon SageMaker Pipelines.
Pour en savoir plus sur l'intégration de Snowflake à Amazon SageMaker Data Wrangler, consultez le blog. Pour commencer à utiliser Amazon SageMaker Data Wrangler, consultez notre documentation et la page Web.