Publié le: Jun 26, 2023
Amazon SageMaker Data Wrangler permet désormais une connexion directe à Snowflake afin de préparer les données et de créer des fonctionnalités pour le machine learning (ML). SageMaker Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le ML de plusieurs semaines à quelques minutes, à l'aide d'une interface visuelle dans Amazon SageMaker Studio.
À compter d'aujourd'hui, les clients peuvent se connecter à Snowflake depuis SageMaker Data Wrangler sans avoir à fournir d'intégration de stockage Amazon Simple Storage Service (Amazon S3) ni à gérer des copies de données durables dans S3. Cette fonctionnalité réduit le temps consacré à la configuration et simplifie la connexion entre SageMaker Data Wrangler et Snowflake, ce qui facilite sa mise à l'échelle à un grand nombre d'utilisateurs au sein de votre organisation. Vous pouvez parcourir les bases de données, les tables, les schémas et interroger les données de Snowflake dans SageMaker Data Wrangler, et les associer à des données provenant d'autres sources de données populaires telles que S3, Amazon Athena, Amazon Redshift, Amazon EMR et plus de 50 applications de SaaS afin de créer le bon ensemble de données pour le machine learning. Vous pouvez ensuite rapidement comprendre la qualité des données, les nettoyer et créer des fonctionnalités avec plus de 300 analyses et transformations de données intégrées à l'aide de l'interface visuelle de SageMaker Data Wrangler. Vous pouvez également entraîner et déployer des modèles avec Amazon SageMaker Autopilot, et automatiser le processus de préparation des données dans le cadre de pipelines de déploiement, d'entraînement ou d'ingénierie des fonctionnalités à l'aide d'Amazon SageMaker Pipelines.
SageMaker Data Wrangler prend en charge la connexion directe à Snowflake dans toutes les régions où est actuellement proposé SageMaker Data Wrangler, et ce sans frais supplémentaires. Pour en savoir plus, consultez cet article de blog et la documentation technique AWS.