发布于: Jun 26, 2023
Amazon SageMaker Data Wrangler 现已支持直接连接到 Snowflake,为机器学习 (ML) 准备数据和创建特征。SageMaker Data Wrangler 使用 Amazon SageMaker Studio 中的可视化界面将汇总和准备用于机器学习的数据所需的时间从数周缩短至几分钟。
自即日起,客户可以从 SageMaker Data Wrangler 连接到 Snowflake,而无需与 Amazon Simple Storage Service (Amazon S3) 存储集成,也无需在 S3 中管理持久数据副本。此功能减少了花在配置上的时间,简化了 SageMaker Data Wrangler 和 Snowflake 之间的连接,让您可以轻松扩展到企业中的大量用户。您可以在 SageMaker Data Wrangler 中浏览数据库、表、模式和查询 Snowflake 中的数据,并与 S3、Amazon Athena、Amazon Redshift、Amazon EMR 和 50 多个 SaaS 应用程序等其他常用数据来源的数据相结合,为机器学习创建合适的数据集。然后,您可以使用 SageMaker Data Wrangler 的可视化界面快速了解数据质量、清理数据并通过 300 多种内置分析和数据转换创建特征。您还可以使用 Amazon SageMaker Autopilot 训练和部署模型,并使用 Amazon SageMaker Pipelines 在特征工程、训练或部署管道中自动完成数据准备过程。