发布于: May 8, 2024
即日起,Amazon Elastic Compute Cloud (Amazon EC2) Inf2 实例将在以下区域全面推出:亚太地区(悉尼)、欧洲地区(伦敦)、欧洲地区(巴黎)、欧洲地区(斯德哥尔摩)、南美洲(圣保罗)。这些实例在用于生成式 AI 模型的 Amazon EC2 中以最低成本提供高性能。
您可以使用 Inf2 实例运行热门应用,例如文本摘要、代码生成、视频和图像生成、语音识别、个性化等。Inf2 实例是 Amazon EC2 中的首个推理优化型实例,引入由 NeuronLink 支持的横向扩展分布式推理,NeuronLink 是一种高速非阻塞互连技术。Inf2 实例提供每秒 2.3 千万亿次浮点运算、384GB 的加速器总内存和每秒 9.8TB 的带宽。
AWS Neuron SDK 与热门的机器学习框架原生集成,因此您可以继续使用现有框架在 Inf2 上部署。开发人员可以通过 AWS 深度学习 AMI、AWS 深度学习容器或托管服务(例如 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker)开始使用 Inf2 实例。
Inf2 实例目前有四种大小可供选择:inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge。此类实例在 13 个 AWS 区域作为按需型实例、预留实例和竞价型实例或作为 Savings Plan 的一部分提供。
要了解有关 Inf2 实例的更多信息,请参阅 Amazon EC2 Inf2 实例网页和 AWS Neuron 文档。