Amazon EC2 Inf2 執行個體現已在韓國推出
即日起,針對生成式 AI 最佳化的 Amazon Elastic Compute Cloud (Amazon EC2) Inf2 執行個體在 AWS 亞太地區 (首爾) 區域正式推出。與相似的 Amazon EC2 執行個體相比,Amazon EC2 Inf2 執行個體最多可降低 40% 的推論成本。
您可以使用 Inf2 執行個體來執行文字摘要、程式碼產生、影片和影像產生、語音辨識、個人化等常見的應用程式。Inf2 執行個體是 Amazon EC2 中第一個推論最佳化的執行個體,導入了由 NeuronLink 支援的橫向擴展分散式推論,這是一種高速、非阻攔式互連。Inf2 執行個體可提供高達 2.3 PFLOPS 和最多 384 GB 的總加速器記憶體,頻寬為 9.8 TB/s。
AWS Neuron SDK 與常見的機器學習架構原生整合,因此您可以繼續使用現有的架構在 Inf2 上進行部署。開發人員可以使用 AWS Deep Learning AMI、AWS Deep Learning Containers 或 Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 和 Amazon SageMaker 等受管服務來開始使用 Inf2 執行個體。
Inf2 執行個體提供四種大小:inf2.xlarge、inf2.8xlarge、inf2.24xlarge、inf2.48xlarge,涵蓋 14 個 AWS 區域,支援隨需執行個體、預留執行個體和 Spot 執行個體或作為 Savings Plan 的一部分的形式。
若要進一步了解 Inf2 執行個體,請參閱 Amazon EC2 Inf2 執行個體網頁和 AWS Neuron 文件。