发布于: Jun 9, 2022

现在,您可以通过 Amazon SageMaker Data Wrangler 中提供的导出功能以比以往更快的速度将特征导出到 Amazon SageMaker Feature Store。Amazon SageMaker Data Wrangler 可将汇总和准备机器学习 (ML) 数据所需的时间从数周缩短至几分钟。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并完成数据准备工作流程的每个步骤,包括通过单个可视界面进行数据选择、清理、探查和可视化。借助 SageMaker Data Wrangler 的数据选择工具,您可以从多个数据来源中快速选择数据,例如 Amazon S3 、Amazon Athena、Amazon Redshift、AWS Lake Formation、Amazon SageMaker Feature Store 和 Snowflake。Amazon SageMaker Feature Store 是一个完全托管的专用存储库,用于存储、更新、检索和共享机器学习 (ML) 特征。

即日起,您只需在 Amazon SageMaker Data Wrangler 中点击几下即可创建特征并将其导出至 Amazon SageMaker Feature Store。以前,在为机器学习准备数据时,设计特征并将其导出到特征存放区中可能需要编写大量代码。现在,您只需点击几下即可使用 SageMaker Data Wrangler 的视觉点击式界面设计特征并将特征导出到 SageMaker Feature Store 中。此外,您还可以在 SageMaker Data Wrangler 中轻松浏览特征组,创建新的特征组,并验证特征组架构。

要开启使用 Amazon SageMaker Data Wrangler 的新功能,您可以在升级到最新版本后打开 Amazon SageMaker Studio,并从菜单中单击 File > New > Flow(文件 > 新建 > 流)或者从 SageMaker Studio 启动程序中单击“new data flow”(新建数据流)。要详细了解新推出的功能,请阅读博客并查看文档