发布于: Dec 1, 2021
Amazon SageMaker 现在增强机器学习 (ML) 沿袭跟踪功能,可让客户在 ML 工作流中跟踪和查询构件的沿袭,例如数据、特征和模型。现在,客户可以通过单一查询检索端到端沿袭图形,其中涵盖从数据准备到模型部署的整个工作流。此功能消除了按一次一个工作流步骤检索沿袭信息并将它们手动拼接在一起所需的无差别繁重工作。客户还可以将步骤定义为焦点并查询该焦点上游或下游步骤的沿袭,从而检索工作流各分段的沿袭信息。例如,客户可以将模型定义为焦点实体,以及检索从中提取特征以训练该模型的原始数据集位置。
这一新功能还支持跟踪跨多个 AWS 账户的工作流步骤的沿袭信息。为各种角色(数据科学家、ML 工程师等)创建多个账户以安排组织内的所有资源是一种常见的 DevOps 实践方法。要启用此功能,客户可以使用 AWS RAM 跨 AWS 账户共享沿袭资源。AWS RAM 有助于减少运营开销并提供共享资源的可见性。经过配置,客户可以使用沿袭查询 API 来跟踪跨多个 AWS 账户的各种构件之间的关系。
ML 沿袭信息可用于改进模型治理、重现先前版本的工件或更有效地排除工作流故障。首先,使用 SageMaker Studio 或开发工具包训练一个新的 ML 模型,并且使用沿袭查询 API 来跟踪沿袭信息。要了解详情,请访问关于基于跨账户图形的沿袭跟踪和沿袭查询 API 的文档页面。