Amazon SageMaker 新增用于模型部署的 ml.g5、ml.p4d 和 ml.c6i 实例

发布于: Jul 15, 2022

Amazon SageMaker 将使用范围扩展到新的机器学习实例，以便客户可以在最适合其工作负载的实例上部署模型。现在，客户可以针对异步和实时模型部署选项使用 ml.g5、ml.p4d 和 ml.c6i 实例。

AWS 的愿景是将机器学习技术普及给日常开发人员，并推广以低成本、即用即付型使用模式提供的前沿基础设施。为了实现这一愿景，我们正在快速创新，不断为机器学习工作负载提供性能更好、成本更低的基础设施。

与 G4dn 实例相比，ml.g5 实例可提供高达 3 倍的性能，并且将机器学习推理的单位成本性能提高了高达 40%。它们是一款高性能且成本高效的解决方案，适用于想要使用诸如 TensorRT、CUDA 和 cuDNN 之类的 NVIDIA 库来运行其机器学习应用程序的客户。这些实例非常适合用于推荐、聊天机器人、智能助手和图像识别等使用案例。ml.g5 实例已在美国东部（弗吉尼亚州北部）、美国西部（俄勒冈州）和欧洲地区（爱尔兰）区域推出。
与上一代 P3 实例相比，ml.p4d 实例为深度学习模型提供平均高达 2.5 倍的性能。每个 GPU 拥有 40GB 的内存，并支持高达 8TB 的本地 NVMe SSD 存储，支持高性能机器学习推理（例如大型语言模型和计算机视觉模型）的大型模型和数据集的本地存储。ml.p4d 实例现已在美国东部（弗吉尼亚州北部）和美国西部（俄勒冈州）区域推出。
ml.c6i 实例由第 3 代英特尔至强可扩展处理器提供支持，与 C5 实例相比，针对各种工作负载提供高出 15% 的单位成本性能。C6i 实例还提供更大的新尺寸，最多可达 128 个 vCPU 和 256GiB 内存，使客户能够在更少的实例上整合工作负载。C6i 实例支持全新英特尔高级矢量扩展 (AVX 512) 指令、英特尔睿频加速技术和英特尔深度学习加速技术，可以进一步提高机器学习工作负载的性能。ml.c6i 现已在所有商业区域推出。

有关这些实例的定价信息，请访问我们的定价页面。

Amazon SageMaker 新增用于模型部署的 ml.g5、ml.p4d 和 ml.c6i 实例

终止对 Internet Explorer 的支持