发布于: Oct 17, 2023

我们很高兴地宣布在新区域推出 ml.p4d、ml.trn1 和 ml.g5 实例的预览版,用于在 Amazon SageMaker 上对机器学习 (ML) 模型进行异步和实时推理。这些实例通常也可用于在其他区域进行推理。

  • ml.p4d.24xlarge 实例现已在 AWS GovCloud(美国西部)、欧洲地区(爱尔兰)、亚太地区(东京)和亚太地区(新加坡)作为预览版提供,可为深度学习模型提供高性能。每个 Nvidia A100 GPU 有 40GB 的内存,P4d 实例可在大型模型和生成式人工智能用例上实现高性能的机器学习推理。
  • ml.trn1 实例现已在美国西部(俄勒冈州)作为预览版提供,它支持 1,000 多亿个参数深度学习和生成式人工智能模型上的高性能推理工作负载,涵盖文本摘要、代码生成和问答等应用程序。
  • ml.g5 实例现已在亚太地区(首尔)和南美洲(圣保罗)作为预览版提供,是推荐、聊天机器人、智能助手和图像识别等用例的理想选择。

要访问这些预览版,只需通过 AWS 服务限额申请提高限额即可。有关这些实例的定价信息,请访问我们的定价页面。有关使用 SageMaker 部署模型的更多信息,请参阅此处的概述和此处的文档。要了解有关预览版实例的更多信息,请参阅 G5 产品页面Trn1 产品页面P4 产品页面