Amazon EC2 單一 GPU P5 執行個體現已正式推出
張貼日期:
2025年8月12日
AWS 今日宣佈全新的 Amazon Elastic Compute Cloud (Amazon EC2) P5 執行個體大小,配有一顆 NVIDIA H100 GPU,讓企業能夠以符合成本效益的方式調整機器學習 (ML) 和高效能運算 (HPC) 資源的規模。
新的執行個體大小可讓客戶從小型尺寸開始使用,並透過細微的增量進行擴展,提供更靈活的基礎架構成本控制。開發中小型大型語言模型 (LLM) (例如聊天機器人或專門語言翻譯工具) 的客戶目前能夠以更經濟的方式執行推論任務。客戶同時可以在無需承諾實行昂貴大規模 GPU 部署的情況下,使用這些執行個體部署用於製藥探索、流體力學分析和財務建模的 HPC 應用程式。
P5.4xlarge 執行個體目前可透過適用於 ML 的 Amazon EC2 容量區塊,在下列 AWS 區域中推出:美國東部 (維吉尼亞北部、俄亥俄)、美國西部 (奧勒岡)、歐洲 (倫敦)、亞太地區 (孟買、雪梨、東京) 和南美洲 (聖保羅) 區域。客戶可在歐洲 (倫敦)、亞太區域 (孟買、雅加達、東京) 和南美洲 (聖保羅) 區域購買這些執行個體的隨需、即時選項,或透過 Savings Plans 購買。
若要進一步了解 P5.4xlarge 執行個體,請造訪 Amazon EC2 P5 執行個體。