Amazon SageMaker 新增用于模型部署的八个基于 Graviton 的实例

发布于: Oct 25, 2022

Amazon SageMaker 将扩展对新增的八个基于 Graviton2 和 Graviton3 机器学习 (ML) 实例系列的访问权限，这样客户在 SageMaker 上部署 ML 模型时，能够拥有更多优化成本和性能的选项。现在，客户可以针对实时和异步推理模型部署选项使用 ml.c7g、ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g 和 ml.r6gd。

Amazon SageMaker 现在支持 7 个实例系列：ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g 和 ml.r6gd，它们均由 AWS Graviton2 处理器提供支持，与同类基于 x86 的第五代实例相比，这些系列以相同的价格为客户提供了高出 40% 的性能，而且适用于各种工作负载。所有商用区域均提供基于 Graviton2 的机器学习 (ML) 实例。要了解所选区域推出了哪些实例系列，请访问我们的定价页面。

在 Graviton2 的改进基础上，与 Graviton2 处理器相比，基于 Graviton3 的实例提供了高出 25% 的性能，浮点性能高出多达 2 倍，基于领先的 DDR5 内存技术的内存访问速度加快了 50%。针对 ML 工作负载，AWS Graviton3 处理器所提供的性能比 AWS Graviton2 处理器高出多达 3 倍，并支持 bfloat16。Amazon SageMaker 现在支持 ml.c7g 实例系列。ml.c7g 实例已在美国东部（俄亥俄州）、美国东部（弗吉尼亚州北部）、美国西部（俄勒冈州）和欧洲地区（爱尔兰）推出。

要开始使用，请在创建 SageMaker 端点配置时选择基于 Graviton 的实例。有关这些实例的定价信息，请访问我们的定价页面。

Amazon SageMaker 新增用于模型部署的八个基于 Graviton 的实例

终止对 Internet Explorer 的支持