发布于: Aug 9, 2023

即日起,Amazon Elastic Compute Cloud (Amazon EC2) Inf2 实例在美国西部(俄勒冈州)区域全面推出。这些实例在用于生成式人工智能模型的 Amazon EC2 中以最低成本提供高性能。

您可以使用 Inf2 实例运行常用应用程序,例如文本摘要、代码生成、视频和图像生成、语音识别、个性化等。Inf2 实例是 Amazon EC2 中的首个推理优化型实例,引入由 NeuronLink 支持的横向扩展分布式推理,NeuronLink 是一种高速非阻塞互连技术。Inf2 实例提供每秒 2.3 千万亿次浮点运算、384GB 的加速器总内存和每秒 9.8TB 的带宽。与其他同类的 Amazon EC2 实例相比,Inf2 实例的性价比提高了多达 40%。 

AWS Neuron SDK 与热门的机器学习框架原生集成,因此您可以继续使用现有框架在 Inf2 上部署。开发人员可以通过 AWS 深度学习 AMI、AWS 深度学习容器或托管服务(例如 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker)开始使用 Inf2 实例。

Inf2 实例有四种大小可供选择:inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge。此类实例在以下 AWS 区域作为按需型实例、预留实例和竞价型实例,或作为 Savings Plan 的一部分提供:美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)。

要了解有关 Inf2 实例的更多信息,请参阅 Amazon EC2 Inf2 实例网页AWS Neuron 文档