AWS 宣布推出 Amazon EC2 Inf2 实例（预览版）

发布于: Nov 29, 2022

今天，AWS 宣布推出 Amazon Elastic Compute Cloud (Amazon EC2) Inf2 实例的预览版，它旨在为高要求的深度学习 (DL) 推理应用程序在 Amazon EC2 中以最低的成本提供高性能。Inf2 实例由多达 12 个 AWS Inferentia2 提供支持，这是 AWS 设计的第三个 DL 加速器。与 Inf1 实例相比，Inf2 实例的计算性能提高了 3 倍，吞吐量提高了 4 倍，延迟降低了 10 倍。

您可以使用 Inf2 实例来运行自然语言理解、翻译、视频和图像生成、语音识别、个性化等方面的 DL 应用程序。这些实例经过优化，可以大规模部署复杂的模型，如大型语言模型 (LLM) 和视觉转换器，同时还可以为较小的模型改进 Inf1 实例的性价比优势。为了支持超大的 100B+ 参数模型，Inf2 实例是 Amazon EC2 中的第一个推理优化实例，可通过加速器之间的超高速连接支持横向扩展分布式推理。

Inf2 实例可提供高达 2.3 PetaFLOPS 的 DL 性能，高达 384GB 加速器内存和 9.8TB/s 带宽以及 NeuronLink，一个实例内超高速、非阻塞互连。与 Amazon EC2 中基于 GPU 的实例相比，Inf2 实例的每瓦性能提高达 50%，帮助您实现可持续发展目标。AWS Neuron SDK 在本机集成了热门的 ML 框架，如 PyTorch 和 TensorFlow，因此只需几行代码即可在 Inf2 上部署 DL 应用程序。

要了解更多信息并注册预览版 Inf2 实例，请参阅 Inf2 产品详细信息页面。

AWS 宣布推出 Amazon EC2 Inf2 实例（预览版）

终止对 Internet Explorer 的支持