发布于: Mar 22, 2023
Amazon SageMaker Data Wrangler 现在支持使用 Okta、Microsoft Azure AD 和 Ping Federate 等身份提供者进行基于 OAuth 的身份验证,以访问 Snowflake 中用于机器学习 (ML) 的数据。Data Wrangler 使用 Amazon SageMaker Studio 中的可视化界面将汇总和准备用于机器学习的数据所需的时间从数周缩短至几分钟。
此次发布让想要使用单一身份提供者的客户能够跨所有应用程序(包括 Snowflake)管理其用户、群组和访问控制。管理员为 Data Wrangler 配置 Snowflake OAuth 访问权限后,您就可以在从 Data Wrangler 连接到 Snowflake 时使用组织身份提供者登录,以便为机器学习引入数据。您可以联接来自其他热门数据来源的数据,例如 Amazon S3、Amazon Athena、Amazon Redshift、Amazon EMR 以及 Data Wrangler 支持的 40 多个 SaaS 应用程序,以创建适合机器学习的数据集。您可以使用 Data Wrangler 的可视化界面快速了解数据质量、清理数据并通过 300 多种内置分析和数据转换创建特征。您还可以通过 SageMaker Autopilot 训练和部署模型,并通过与 SageMaker Pipeline 的集成,在特征工程、训练或管道中操作数据准备过程,所有这些都在 Data Wrangler 中进行。