Amazon SageMaker

机器学习面向每位开发人员和数据科学家

Amazon SageMaker 是一项完全托管的服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习 (ML) 模型。SageMaker 完全消除了机器学习过程中每个步骤的繁重工作,让开发高质量模型变得更加轻松。

传统的 ML 开发是一个复杂、昂贵、迭代的过程,而且没有任何集成工具可用于整个机器学习工作流程,这让它难上加难。您需要将工具和工作流程拼接在一起,这既耗时又容易出错。SageMaker 在单个工具集中提供了用于机器学习的所有组件,让这一难题迎刃而解,因此模型通过更少的工作量和更低的成本即可更快地投入生产。

使用 Amazon SageMaker 构建安全且合规的机器学习工作流程 (58:37)

构建机器学习模型

Amazon SageMaker Ground Truth 可将数据标记成本降低高达 70%

Amazon SageMaker Ground Truth 帮助您快速构建和管理高度准确的训练数据集。Ground Truth 通过 Amazon Mechanical Turk 提供对标签机的便捷访问,并为它们提供预先构建的工作流程和接口以便执行常见的标记任务。您还可以使用自己的标签机或通过 AWS Marketplace 联系 Amazon 推荐的供应商。此外,Ground Truth 持续向人工制作的标签学习以生成高质量的自动注释,从而大大降低标记成本。

了解更多 »

使用单一 Web 界面构建模型

Amazon SageMaker 提供访问和共享笔记本以及使用内置算法和框架所需的所有内容,因此您可以轻松地大规模构建机器学习 (ML) 模型并为训练做好准备。Amazon SageMaker Studio 是首个适用于机器学习的完全集成式开发环境 (IDE)。您可以快速上传数据、创建新笔记本、训练和调优模型,在步骤之间来回移动以调整实验、对比结果以及将模型部署到生产环境中,而且上述所有工作都在一个地方完成。您可以将 Amazon SageMaker Autopilot 与 SageMaker Studio 结合使用,以自动生成模型。SageMaker Autopilot 是业内首个自动化机器学习功能,可让您完全掌控 ML 模型。只需单击几下,SageMaker Autopilot 即可自动检查原始数据、应用功能处理器、选择最佳算法集、训练和调优多个模型、跟踪模型性能以及对模型进行排名。 

Amazon SageMaker Notebooks 是可共享的一键式 Jupyter 笔记本,可以快速启动。您还可以从 AWS Marketplace 中提供的数十个预先构建的 SageMaker 笔记本或数百个算法和预训练模型中选择。

Amazon SageMaker 支持领先的深度学习框架

Amazon SageMaker Autopilot 入门 (8:44)
探索 Amazon SageMaker Autopilot 生成的笔记本 (10:04)
使用 Amazon Sagemaker Autopilot 调优模型参数 (4:58)
可视化并比较生成的模型指标 (5:20)

训练机器学习模型

Amazon SageMaker 可提供调优和调试模型以及执行训练实验所需的一切,从而简化了机器学习 (ML) 模型训练过程。

Amazon SageMaker Experiments 通过自动捕获输入参数、配置和结果并将其存储为“实验”来帮助您管理迭代。您可以使用 SageMaker Studio 的可视化界面来浏览进行中的实验,根据实验特征搜索先前的实验、查看先前的实验及结果,以及直观比较实验结果。

Amazon SageMaker 调试程序能够在训练期间自动捕获实时指标(例如,训练和验证、混淆矩阵和学习梯度),让训练流程更加透明,最终提高模型精度。SageMaker Studio 中会直观呈现来自 SageMaker 调试程序的指标,以便您理解。检测到常见的训练问题时,SageMaker 调试程序还会生成警告及提供修复建议。

您可以使用托管的 Spot 训练将训练机器学习模型的成本降低高达 90%。托管的 Spot 训练使用 Amazon EC2 Spot 实例,因此与使用 Amazon EC2 按需实例相比,您的训练作业的运行成本要低得多。

托管的 Spot 训练入门 (11:53)
如何使用 Amazon SageMaker 调试程序 (14:17)

部署机器学习模型

Amazon SageMaker 可提供在生产环境中部署机器学习模型和监控模型质量所需的一切,以此支持您轻松生成预测。

您能够依靠 Amazon SageMaker 模型监控器来检测和修复概念偏差。现在,影响已部署模型的精度的一个重要因素是,用于生成预测的数据与用于训练模型的数据是否有所不同。例如,日新月异的经济条件可能会推动新利率出台,从而影响购房预测。这就是概念偏差,此时模型用于预测的模式不再适用。SageMaker 模型监控器会自动检测已部署模型中的概念偏差,并提供详细的警报,帮助确定问题的根源。通过 SageMaker 训练的所有模型都会自动发送关键指标,这些指标可以在 SageMaker Studio 中收集和查看。从 SageMaker Studio 内部,您可以配置要收集的数据、查看方式以及警报的接收时间。

许多机器学习应用程序都要求人工审核低置信度预测,以确保结果正确无误。Amazon Augmented AI 可轻松构建 ML 预测人工审核所需的工作流程。您可以使用 Amazon Augmented AI 为构建于 Amazon SageMaker 上的模型创建自己的工作流程。

部署好模型后,您可以使用 Amazon Elastic Inference 优化基础设施的使用。借助 Elastic Inference,您可向任何 Amazon SageMaker 实例类型连接适当量级的 GPU 推理加速。 

部署模型并打开 Amazon SageMaker 模型监控器 (9:08)
如何使用 Amazon Elastic Inference 节省成本 (10:29)
开始在控制台中构建
开始在控制台中构建

Amazon SageMaker 入门

控制台