Amazon EC2 Inf2 实例现已在韩国推出

发布于: 2025年5月7日

即日起,针对生成式 AI 进行了优化的 Amazon Elastic Compute Cloud (Amazon EC2) Inf2 实例在 AWS 亚太地区(首尔)区域全面推出。与同类 Amazon EC2 实例相比,Amazon EC2 Inf2 实例的推理成本可降低多达 40%。

您可以使用 Inf2 实例运行常用应用程序,例如文本摘要、代码生成、视频和图像生成、语音识别、个性化等。Inf2 实例是 Amazon EC2 中的首个推理优化型实例,引入由 NeuronLink 支持的横向扩展分布式推理,NeuronLink 是一种高速非阻塞互连技术。Inf2 实例提供每秒 2.3 千万亿次浮点运算、384GB 的加速器总内存和每秒 9.8TB 的带宽。

AWS Neuron SDK 与热门的机器学习框架原生集成,因此您可以继续使用现有框架在 Inf2 上部署。开发人员可以通过 AWS 深度学习 AMI、AWS 深度学习容器或托管服务(例如 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker)开始使用 Inf2 实例。

Inf2 实例目前有四种大小可供选择:inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge。此类实例在 14 个 AWS 区域作为按需型实例、预留实例和竞价型实例或作为节省计划的一部分提供。

要了解有关 Inf2 实例的更多信息,请参阅 Amazon EC2 Inf2 实例网页AWS Neuron 文档