发布于: Nov 29, 2023
Amazon SageMaker 笔记本作业使数据科学家只需在 Amazon SageMaker Studio(一种基于 Web 的、用于机器学习 (ML) 的 IDE)中单击几下鼠标,即可按需或按计划运行笔记本。今天,我们很高兴地宣布,您可以使用 SageMaker Pipelines(SageMaker 的 ML 工作流编排服务)提供的 API 以编程方式将笔记本作为作业运行。此外,您还可以使用这些 API 创建包含多个依赖笔记本的多步骤 ML 工作流。
数据科学家可以将 SageMaker 笔记本作业用于运行长时间运行的笔记本和定期生成报告等使用案例,以及从准备小型样本数据集扩展到处理 PB 级大数据。将这些笔记本移至生产环境时,客户需要 API 支持,以便在 CI/CD 工作流中以编程方式执行笔记本。此次发布将笔记本作业作为内置步骤类型(在使用 Amazon SageMaker Pipelines 构建管道时)引入。客户可以利用此笔记本作业步骤,通过使用 Amazon SageMaker Python SDK 编写几行代码,轻松地将笔记本作为作业运行。此外,客户还可以将多个依赖笔记本拼接在一起,以有向无环图 (DAG) 的形式创建工作流。然后,客户可以运行这些笔记本作业或 DAG,使用 Amazon SageMaker Studio 进行管理和可视化。
此功能现已在提供 Amazon SageMaker Studio 的所有 AWS 商业区域全面推出。要了解更多信息,请参阅 SageMaker Studio 开发人员指南或功能博客。