发布于: Dec 13, 2023

即日起,Amazon Elastic Compute Cloud (Amazon EC2) Inf2 实例将在以下区域正式推出:亚太地区(孟买)、亚太地区(新加坡)、亚太地区(东京)、欧洲地区(爱尔兰)和欧洲地区(法兰克福)。这些实例在用于生成式人工智能模型的 Amazon EC2 中以最低成本提供高性能。 

您可以使用 Inf2 实例运行常用应用程序,例如文本摘要、代码生成、视频和图像生成、语音识别、个性化等。Inf2 实例是 Amazon EC2 中的首个推理优化型实例,引入由 NeuronLink 支持的横向扩展分布式推理,NeuronLink 是一种高速非阻塞互连技术。Inf2 实例提供每秒 2.3 千万亿次浮点运算、384GB 的加速器总内存和每秒 9.8TB 的带宽。与其他同类的 Amazon EC2 实例相比,Inf2 实例的性价比提高了多达 40%。

AWS Neuron SDK 与热门的机器学习框架原生集成,因此您可以继续使用现有框架在 Inf2 上部署。开发人员可以通过 AWS 深度学习 AMI、AWS 深度学习容器或托管服务(例如 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker)开始使用 Inf2 实例。

Inf2 实例目前有四种大小可供选择:inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge。此类实例在 8 个 AWS 区域作为按需型实例、预留实例和竞价型实例或作为 Savings Plan 的一部分提供。

要了解有关 Inf2 实例的更多信息,请参阅 Amazon EC2 Inf2 实例网页AWS Neuron 文档