发布于: Jun 8, 2021
Amazon SageMaker Data Wrangler 可将聚合和准备机器学习(ML)数据所需的时间从数周缩短至几分钟。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并完成数据准备工作流程的每个步骤,包括通过单个可视界面进行数据选择、清理、探查和可视化。从今天起,您可以将 Snowflake 作为 Amazon SageMaker Data Wrangler 中的数据源,从而轻松在 Snowflake 中准备机器学习数据。
通过将 Snowflake 作为 Amazon SageMaker Data Wrangler 的数据源,您现在无需编写任何代码,即可轻松快速地连接到 Snowflake。此外,您现在还可求 Snowflake 中数据与存储在 Amazon S3 中的数据以及通过 Amazon Athena 和 Amazon Redshift 查询到的数据的交集,从而准备机器学习数据。连接之后,您可以通过交互式的方式查询存储在 Snowflake 中的数据,使用 300 多种预先配置的数据转换轻松转换数据据,理解数据,以及使用多种稳健的预先配置的可视化模板来识别潜在的错误和极值。您还可以快速识别数据准备工作流中的不一致之处,并在将模型部署到生产环境之前诊断问题。最后,您可以将数据准备工作流导出到 Amazon S3,以便与其他 SageMaker 功能结合使用,例如 Amazon SageMaker Autopilot、Amazon SageMaker Feature Store 和 Amazon SageMaker Pipelines。