发布于: Oct 21, 2022

今天,我们很高兴地宣布支持在 Amazon SageMaker Data Wrangler 中计划 Data Wrangler 处理作业。Amazon SageMaker Data Wrangler 可将汇总和准备机器学习 (ML) 数据所需的时间从数周缩短至几分钟。借助 SageMaker Data Wrangler,您可以简化数据准备和特征工程的过程,并完成数据准备工作流的每个步骤,包括通过单个可视界面进行数据选择、清理、探查和可视化。之前,计划数据处理作业涉及与无服务器计算功能和事件总线服务集成。此过程还涉及编写代码来计划生产环境中的数据处理作业。对于数据科学家、数据工程师和机器学习工程师来说,将这些不同的功能集成在一起并编写代码来编排此工作流可能是一项费时又费力的任务。

由于现已支持在 Data Wrangler 中计划作业,只需单击几下即可计划 Data Wrangle 处理作业。可以安排作业在一周中的特定时间和几天运行。也可以将计划作为 CRON 表达式输入,以获得更多的自定义和灵活性(例如,安排作业在日历月的第一个星期三运行)。最多可以在一个 Data Wrangler 处理作业中附加两个计划。输入所需的计划后,Data Wrangler 将显示接下来即将运行的五个作业的预览,以供进一步确认。您可以在 Data Wrangler 的“创建作业”工作流中访问该计划功能,它是该工作流的一部分。

此功能已在 Data Wrangler 目前支持的所有 AWS 区域全面推出,不额外收费。要开始使用 SageMaker Data Wrangler 计划数据处理作业,请阅读 AWS 文档