Amazon SageMaker

机器学习适用于每位开发人员和数据科学家。

Amazon SageMaker 为每位开发人员和数据科学家提供快速构建、训练和部署机器学习模型的能力。Amazon SageMaker 是一项完全托管的服务,它覆盖了整个机器学习工作流程,以标记和准备数据、选择算法、训练算法、调整和优化部署、进行预测并采取行动。您的模型将通过更少的工作量和更低的成本更快地投入生产。

构建

收集和准备训练数据

针对常见问题的数据标记和预先构建笔记本

选择并优化您的 ML 算法

模型和算法市场以及内置的高性能算法

训练

设置和管理训练环境

最高性能的基础设施上的一键式训练

训练和调整模型

训练一次,即可在任何位置运行和模型优化

部署

在生产环境中部署模型

一键式部署

扩展和管理生产环境

使用 Auto Scaling 彻底管理实现 75% 的节省


精选客户

logo-statefarm
logo-intuit
logo-Siemens
logo-nfl
logo-Expedia-Group
logo-liberty_mutual
logo-FI
logo-coinbase
logo-roche
logo-convoy
logo-korean_air
change-healthcare-logo-white

收集和准备训练数据

快速标记训练数据

Amazon SageMaker 真实值帮助您快速构建和管理高度准确的训练数据集。真实值提供对公有和私有人力贴标签机的方便访问,并为它们提供预先构建的工作流程和接口以便执行常见标记任务。此外,真实值将向人力标签学习以制作高质量的自动注释,从而大大降低标记成本。

了解更多 »
pull-70p
infographic-Ground_Truth

选择和优化您的机器学习算法

Amazon SageMaker 将自动配置和优化 TensorFlow、Apache MXNet、PyTorch、Chainer、Scikit-learn、SparkML、Horovod、Keras 和 Gluon。常用机器学习算法是内置的,将根据 AWS Marketplace 提供的百种以上的其他预先训练模型和算法的规模、速度和准确率进行调整。您还可以通过在 Docker 容器中构建任何其他算法或框架来引入算法或框架。

logo-tesnorflow
logo-mxnet
logo-pytorch
logo-chainer
logo-keras
logo-gluon
logo-horovod
pull-10x

设置和管理训练环境

SageMaker_Chart_3

一键式训练

一键式开始训练您的模型。Amazon SageMaker 处理所有底层基础设施以轻松扩展到 PB 大小的数据集。

Amazon EC2 P3 实例提供 8 个经过优化的 NVIDIA Tesla V100 GPU,以在云中实现最快的分布式机器学习。
最高性能 GPU 实例
云中
25 GBPS
联网吞吐量
64 可扩展 vCPU
Intel® Xeon® Skylake with AVX-512
16 GB 内存
每 GPU

运行 TensorFlow 的最佳位置

AWS 的 TensorFlow 优化,用于跨在云级别操作的数百个 GPU 提供近线性扩展效率,而且没有大量处理开销,可在更短的时间内训练更准确、更专业的模型。

STOCK TENSORFLOW
img-65p
AWS 经过优化的 TENSORFLOW
img-90p

使用 256 个 GPU 的扩展效率

Amazon SageMaker 是在云中运行 TensorFlow 的最佳位置
完全托管
训练和托管
近线性扩展
跨数百 GPU
推理成本降低 75%
使用 Amazon Elastic Inference

调整和优化您的模型

自动调整您的模型

自动模型优化使用机器学习快速调整您的模型,使其尽可能准确。利用此功能,您可以跳过冗长的手动调整模型参数的试错过程。取代多次训练运行,自动模型优化通过发现数据中有趣的特性并了解这些特性如何交互影响准确率来执行超级参数优化。节省数日甚至数周的时间,从而最大限度提高受训模型的质量。

训练一次,即可在任何位置运行

利用 Amazon SageMaker Neo,您只需训练模型一次,即可在任何位置部署它。利用机器学习,SageMaker Neo 将自动优化使用您指定的硬件平台的常用框架构建的任何受训模型,准确率不会有任何折减。之后您可以将模型部署到 EC2 实例和 SageMaker 实例,或者包括 Neo 运行时的任何边缘设备(包括 AWS Greengrass 设备)。

了解更多 »

pull-2x
pull-1-10
img-neo

在生产环境中部署和管理模型

一键式部署到生产

Amazon SageMaker 可以轻松在生产环境中一键式部署您的受训模型,以便您可以开始针对实时或批量数据生成预测(该过程称为推理)。您的模型在跨多个可用区的 Amazon SageMaker 实例的 auto-scaling 集群上运行,以交付高性能和高可用性。Amazon SageMaker 还包含内置的 A/B 测试功能,以帮助您测试模型并试验不同的版本以获得最佳效果。

在边缘处运行模型

AWS Greengrass 简化了将使用 Amazon SageMaker 训练的模型部署到边缘设备上以运行推理的过程。借助 AWS Greengrass,互联设备可以运行 AWS Lambda 函数、同步设备数据,以及与其他设备安全通信 – 甚至无需连接到 Internet。

pull-75p

通过使用 Amazon Elastic 推理将弹性 GPU 加速轻松连接到 Amazon SageMaker 实例,将您的深度学习推理成本减少多达 75%。对于大多数模型,完整 GPU 实例的大小过大,无法用于推理。此外,可能难以通过单一实例类型优化您的深度学习应用程序的 GPU、CPU 和内存需求。利用 Elastic Inference,您可以选择最适合您的应用程序的整体 CPU 和内存需求的实例类型,然后单独配置推理所需的正确 GPU 加速量。

了解更多 »

img-TFLOPS

支持

logo-tesnorflow
logo-mxnet

客户成功案例

使用完全托管的强化学习构建后续步骤

small-RL-icon

使用强化学习 (RL) 构建复杂的模型,这些模型可以实现特定的成果,而且不需要预先标记的训练数据。在没有“正确”答案可供学习的情况下,RL 非常有用,但像学开车或开展积极金融交易一样,有一个最佳结果。RL 算法学习不是研究历史数据,而是在模拟器中采取行动,其中奖励和惩罚有助于将模型引导至所需的行为。

Amazon SageMaker RL 包括内置、完全托管的 RL 算法。SageMaker 在多个框架(包括 TensorFlow 和 MXNet)以及为强化学习从头设计的定制开发框架(如 Intel Coach 和 Ray RLlib)中都支持 RL。

Amazon SageMaker RL 还支持多个 RL 环境,包括完整的 2D 和 3D 物理环境、MATLAB 和 Simulink 等商业模拟环境,以及支持开源 OpenAI Gym 接口的任何环境(包括定制开发的环境)。此外,SageMaker RL 将允许您使用 Amazon Sumerian 和 AWS RoboMaker 中内置的虚拟 3D 环境进行训练。这意味着,您可以为一切内容(从广告和金融系统到工业控制、机器人和无人驾驶汽车)建模。

开放、灵活

选择机器学习作为您的方法

机器学习技术发展很快,您应该能够持续灵活地访问一组广泛的框架和工具。有了 Amazon SageMaker,您可以使用任何常用框架的内置容器,也可以带入您喜欢的框架。无论哪种方式,Amazon SageMaker 都将完全管理构建、训练和部署您的模型所需的底层基础设施。

更好的边缘性能

SageMaker Neo 的功能还可供每位开发人员用于开源 Neo 项目。我们认为,让任何人能在任何位置运行模型是机器学习发挥其全部潜力的必要步骤。通过参与开源工作,硬件供应商可以通过新的优化改进 Neo,并推进机器学习的整个硬件生态系统。

SageMaker 适合您的工作流程

实际上,Amazon SageMaker 由以下独立组件构成:真实值、笔记本、训练、Neo 和托管。这些组件旨在协同工作,以提供端到端的机器学习服务。但是,它们也可以独立用于补充现有机器学习工作流程,或者支持在您的数据中心或边缘运行的模型。

学习和加速

ImgHead_Silverstone_TEST_Car_3

AWS DeepRacer

一辆完全自主的 1/18 比例的赛车,装满了您学习自主驾驶需要了解的一切内容。

了解更多 »

AWS DeepLens

通过项目、教程和开发人员对世界一流启用深度学习的视频摄像机的探索来学习计算机视觉。

了解更多 »

AWS Machine Learning 培训和认证

AWS Machine Learning 学院。结构化的机器学习课程,基于用于通过基础知识与现实应用的组合来为 Amazon 开发人员培训的相同材料。

了解更多 »

Amazon ML Solutions Lab

Amazon ML 解决方案实验室将您的团队您 Amazon 的机器学习专家配对。它将动手教育研讨会与集体讨论会和专业咨询服务结合起来,帮助您从业务挑战中“逆向工作”,然后逐步完成将模型放入生产环境的过程。之后,您将能够将所学用于组织任何位置,以求得更多机会。

了解更多 »