发布于: Dec 3, 2019
Amazon SageMaker Processing 是 Amazon SageMaker 的一项新功能,用于以完全托管的方式运行预处理或后处理以及模型评估工作负载。
数据预处理或后处理以及模型评估步骤是典型机器学习 (ML) 工作流程的重要组成部分。通常,这些任务是在独立的基础设施上运行的。而在多个用户之间管理和扩展此基础设施极具挑战性且成本高昂。如果要使用各种工具来实现这个目标,需要相当繁重的工作,这就导致开发人员和数据科学家在调整基础设施的性能和规模方面需要花费大量时间。
借助 Amazon SageMaker Processing,客户可以轻松大规模地在 Amazon SageMaker 上运行有关数据工程和模型评估的分析作业。与训练和托管等其他重要的 ML 任务相结合之后,SageMaker Processing 使客户能够享受完全托管环境的好处以及 Amazon SageMaker 中内置的各种安全性和合规性保证。借助 Amazon SageMaker Processing,客户可以灵活地使用内置数据处理容器或自带容器,并提交要在托管基础设施上运行的自定义作业。在提交之后,Amazon SageMaker 将启动计算实例、处理和分析输入数据并在完成后释放资源。