发布于: Oct 25, 2022

Amazon SageMaker 将扩展对新增的八个基于 Graviton2 和 Graviton3 机器学习 (ML) 实例系列的访问权限,这样客户在 SageMaker 上部署 ML 模型时,能够拥有更多优化成本和性能的选项。现在,客户可以针对实时和异步推理模型部署选项使用 ml.c7g、ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g 和 ml.r6gd。

Amazon SageMaker 现在支持 7 个实例系列:ml.m6g、ml.m6gd、ml.c6g、ml.c6gd、ml.c6gn、ml.r6g 和 ml.r6gd,它们均由 AWS Graviton2 处理器提供支持,与同类基于 x86 的第五代实例相比,这些系列以相同的价格为客户提供了高出 40% 的性能,而且适用于各种工作负载。所有商用区域均提供基于 Graviton2 的机器学习 (ML) 实例。要了解所选区域推出了哪些实例系列,请访问我们的定价页面

在 Graviton2 的改进基础上,与 Graviton2 处理器相比,基于 Graviton3 的实例提供了高出 25% 的性能,浮点性能高出多达 2 倍,基于领先的 DDR5 内存技术的内存访问速度加快了 50%。针对 ML 工作负载,AWS Graviton3 处理器所提供的性能比 AWS Graviton2 处理器高出多达 3 倍,并支持 bfloat16。Amazon SageMaker 现在支持 ml.c7g 实例系列。ml.c7g 实例已在美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)和欧洲地区(爱尔兰)推出。

要开始使用,请在创建 SageMaker 端点配置时选择基于 Graviton 的实例。有关这些实例的定价信息,请访问我们的定价页面