Publié le: Mar 22, 2023
Amazon SageMaker Data Wrangler prend désormais en charge l'authentification basée sur OAuth avec des fournisseurs d'identité tels qu'Okta, Microsoft Azure AD et Ping Federate pour accéder aux données dans Snowflake pour le machine learning (ML). Data Wrangler réduit le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning, qui passe de plusieurs semaines à quelques minutes à l'aide d'une interface visuelle dans Amazon SageMaker Studio.
Ce lancement permet aux clients qui souhaitent utiliser un seul fournisseur d'identité de gérer leurs utilisateurs, leurs groupes et le contrôle d'accès sur toutes les applications, y compris Snowflake. Une fois que les administrateurs ont configuré l'accès Snowflake OAuth pour Data Wrangler, vous pouvez vous connecter à l'aide du fournisseur d'identité de votre organisation lorsque vous vous connectez de Data Wrangler à Snowflake pour importer des données pour le ML. Vous pouvez associer des données provenant d'autres sources de données populaires telles qu'Amazon S3, Amazon Athena, Amazon Redshift, Amazon EMR et plus de 40 applications SaaS prises en charge par Data Wrangler afin de créer le bon ensemble de données pour le machine learning. Vous pouvez rapidement comprendre la qualité des données, les nettoyer et créer des fonctionnalités grâce à plus de 300 analyses et transformations de données intégrées à l'aide de l'interface visuelle de Data Wrangler. Vous pouvez également entraîner et déployer un modèle avec SageMaker Autopilot, et opérationnaliser le processus de préparation des données dans le cadre d'une ingénierie de fonctionnalités, d'une formation ou d'un pipeline en intégrant SageMaker Pipeline, le tout à partir de Data Wrangler.
Data Wrangler prend en charge les connexions Okta, Microsoft Azure AD et Ping Federate pour Snowflake dans toutes les régions actuellement prises en charge par Data Wrangler, sans frais supplémentaires. Pour en savoir plus, consultez cet article de blog et la documentation technique AWS.