Amazon EC2 Inf2 執行個體現已在韓國推出

張貼日期: 2025年5月7日

即日起，針對生成式 AI 最佳化的 Amazon Elastic Compute Cloud (Amazon EC2) Inf2 執行個體在 AWS 亞太地區 (首爾) 區域正式推出。與相似的 Amazon EC2 執行個體相比，Amazon EC2 Inf2 執行個體最多可降低 40% 的推論成本。

您可以使用 Inf2 執行個體來執行文字摘要、程式碼產生、影片和影像產生、語音辨識、個人化等常見的應用程式。Inf2 執行個體是 Amazon EC2 中第一個推論最佳化的執行個體，導入了由 NeuronLink 支援的橫向擴展分散式推論，這是一種高速、非阻攔式互連。Inf2 執行個體可提供高達 2.3 PFLOPS 和最多 384 GB 的總加速器記憶體，頻寬為 9.8 TB/s。

AWS Neuron SDK 與常見的機器學習架構原生整合，因此您可以繼續使用現有的架構在 Inf2 上進行部署。開發人員可以使用 AWS Deep Learning AMI、AWS Deep Learning Containers 或 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker 等受管服務來開始使用 Inf2 執行個體。

Inf2 執行個體提供四種大小：inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge，涵蓋 14 個 AWS 區域，支援隨需執行個體、預留執行個體和 Spot 執行個體或作為 Savings Plan 的一部分的形式。

若要進一步了解 Inf2 執行個體，請參閱 Amazon EC2 Inf2 執行個體網頁和 AWS Neuron 文件。

Amazon EC2 Inf2 執行個體現已在韓國推出

了解

資源

開發人員

說明