AWS 推出三款由自行研發晶片支援的新 Amazon EC2 執行個體
Amazon EC2 C7g 執行個體由新的 Amazon Graviton3 處理器支援,與 Amazon Graviton2 處理器支援的當前一代 C6g 執行個體相比,運算密集型工作負載效能提高多達 25%
Amazon EC2 Trn1 執行個體由 Amazon Trainium 晶片支援,在 Amazon EC2 中為絕大多數機器學習模型訓練提供最佳性價比及最快的訓練速度
Amazon EC2 Im4gn/Is4gen/I4i 執行個體配備新的 Amazon Nitro SSDs,可為 I/O 密集型工作負載提供最佳儲存效能
AWS 於今(1)日 re:Invent 年度盛會上宣佈,推出三款由自行研發晶片支援的新Amazon Elastic Compute Cloud(Amazon EC2)執行個體,説明客戶借重 Amazon EC2 的運作顯著地改善工作負載的效能、成本和能源效率。新 C7g 執行個體由 Amazon Graviton3 處理器支援,和由 Amazon Graviton2 處理器支援的當前一代 C6g 執行個體相比,效能提高 25%。由 Amazon Trainium 晶片支援的新 Trn1 執行個體為在 Amazon EC2 絕大多數機器學習模型的訓練中提供最佳性價比以及最快的訓練速度。而全新自行研發 Amazon Nitro SSDs(固態驅動器)的新儲存優化型 Im4gn/Is4gen/ I4i 執行個體可為I/O 密集型工作負載提供最佳儲存效能。上述這些基於 AWS 自行研發晶片的新 Amazon EC2 執行個體的發布,幫助 AWS 為客戶提供支援著最關鍵的業務應用程式。
AWS Amazon EC2 副總裁 David Brown 表示:「我們對自行研發晶片的持續投入與升級,已經讓客戶在當前一些最關鍵工作負載中獲得巨大的性價比優勢。客戶希望我們在每一代新的 EC2 執行個體上不斷地有所突破,我們的創新意味著為客戶提供改變遊戲規則、且為 AWS 獨有的全新執行個體,讓客戶在執行其最重要的工作負載時,獲得比其他任何地方都要更好的性價比。」
C7g 執行個體由新的 Amazon Graviton3 處理器支援,與由 Amazon Graviton2 處理器支援的當前一代 C6g 執行個體相比,效能提高達 25%
Amazon Graviton2 的運算執行個體自 2020 年推出以來,被眾多客戶如 DirecTV、Discovery、Epic Games、Formula 1、Honeycomb.io、Intuit、Lyft、MercardoLibre、NextRoll、Nielsen、SmugMug、Snap、Splunk 和 Sprinklr 等在生產中使用,並已獲得在效能上的顯著提升以及成本的樽節。基於 Graviton2 的系列執行個體共有 12 種,包括通用型、運算優化型、記憶體優化型、儲存優化型、突發效能型和加速運算型等執行個體,讓客戶擁有雲端最深入和最廣泛的運算選擇,兼顧性價比和效能。隨著客戶於雲端開展出更多運算密集型工作負載如高效能運算(HPC)、遊戲和機器學習推論,相應的運算、儲存、記憶體和網路需求也隨之增長,客戶需要尋求更佳的性價比和效能來執行這些工作負載。
由 Amazon Graviton3 處理器支援的C7g執行個體,與由 Graviton2 處理器支援的前一代 C6g 執行個體相比,可將運算密集型工作負載效能提高達 25%。Amazon Graviton3 處理器與 Graviton2 相比,為科學運算、機器學習和媒體編碼工作負載提供高達 2 倍的浮點運算效能,為加密工作負載速度提升高達2倍,為機器學習工作負載提供高達 3 倍的效能。Amazon Graviton3 處理器的能源效率也更高,在相同效能下,與同類型 EC2 執行個體對比,可節省高達 60% 的能源消耗。C7g 執行個體為雲端第一個採用最新DDR5 記憶體的執行個體,與基於 Amazon Graviton2 的執行個體相比,它能提高50%的記憶體頻寬,進而也提升科學運算等記憶體密集型應用的效能。與基於 Amazon Graviton2 的執行個體相比,C7g 執行個體的網路頻寬也高出 20%。C7g 執行個體支援 Elastic Fabric Adapter(EFA),允許應用程式直接與網路介面卡通訊,提供更低且更一致的延遲,提高需要大規模平行處理(如 HPC 和視頻編碼)的應用程式效能。C7g 執行個體現已提供預覽版。欲瞭解更多 C7g 執行個體的資訊,請瀏覽:aws.amazon.com/ec2/instance-types/c7g。
由 Amazon Trainium 晶片支援的 Trn1 執行個體,為在 Amazon EC2 中深度學習模型的訓練上提供最佳性價比以及最快的機器學習模型訓練速度;與 P4d 執行個體相比,透過 Trn1 執行個體訓練深度學習模型的成本降低達 40%。Trn1 執行個體提供 800Gbps EFA 網路頻寬(比最新基於 GPU 的 EC2 執行個體高出兩倍),並與 Amazon FSx for Lustre 高效能儲存整合,讓客戶得以啟動具有 EC2 UltraClusters 功能的 Trn1 執行個體。透過 EC2 UltraClusters,開發人員可以將機器學習訓練擴展到超過上萬個與 PB 級網路互連的 Trainium 加速器,讓客戶能夠按照需求存取超級運算等級的效能,即便是最大型和最複雜的模型,訓練時間也可從幾個月縮短到幾天。Trn1 執行個體現已提供預覽版。欲瞭解更多 Trn1 執行個體的資訊,請瀏覽: aws.amazon.com/ec2/instance-types/trn1。
採用全新 Amazon Nitro SSDs 的 Im4gn/Is4gen/ I4i 執行個體可為 I/O 密集型工作負載提供最佳儲存效能
如今,客戶將 I3/I3en 儲存優化型執行個體用於需要直接存取儲存於本機資料集的應用程式,比如橫向擴展的交易型和關聯式資料庫(如 MySOL 和 PostgreSQL),NoSQL資料庫(如 Cassandra、MongoDB、Redis 等),大數據(如 Hadoop)和資料分析工作負載(如 Spark、Hive、Presto 等)。I3/I3en 執行個體以低成本提供 NVMe SSD 支援的執行個體儲存,針對低延遲、高 I/O 效能和傳輸量進行優化。客戶喜歡 I3/I3en 執行個體提供的快速交易處理能力,但隨著其工作負載的不斷升級——在更大規模的資料集上處理更複雜的交易,他們需要在不增加成本的情況下獲得更高的運算效能和更快的資料存取速度。
Im4gn/Is4gen/I4i 執行個體旨在透過架構,最大化提升 I/O 密集型工作負載的儲存效能。Im4gn/Is4gen/I4i 執行個體透過自行研發的 Amazon Nitro SSDs 提供高達 30 TB 的 NVMe 儲存,與上一代 I3 執行個體相比,I/O 延遲降低 60%,延遲可變性則降低 75%,從而最大限度地提升應用程式效能。Amazon Nitro SSDs 透過優化儲存堆疊、虛擬化管理程式和硬體與 Amazon Nitro 系統緊密整合。相較於商用 SSD,AWS 同時管理 Amazon Nitro SSDs 的硬體和韌體,使 SSD 更新的交付速度更快,讓客戶可以從改進的功能中獲益。Im4gn 執行個體(現已可用)採用 Amazon Graviton2 處理器,與 I3 執行個體相比,性價比提高多達 40%,每 TB 儲存成本降低多達 44%。Is4gen 執行個體(現已可用)也採用 Amazon Graviton2 處理器,與 I3en 執行個體相比,每 TB 儲存成本降低多達 15%,運算效能提高多達 48%。欲使用 Im4gn/Is4gn 執行個體,請瀏覽: aws.amazon.com/ec2/instance-types/i4g。I4i 執行個體(即將可用)採用 Intel 第三代可擴展處理器(Ice Lake),與前一代 I3 執行個體相比,運算效能提高多達 55%。欲瞭解更多 Im4gn/Is4gen/I4i 執行個體的資訊,請瀏覽: aws.amazon.com/ec2/instance-types/i4i。
一級方程式(F1)賽車始於 1950 年,是世界上最負盛名的賽車比賽,也是全球最受歡迎的年度體育賽事。一級方程式技術長 Pat Symonds 表示:「基於 Amazon Graviton2 處理器的 C6g 執行個體已經為我們的一些運算流體模擬力學(CFD)工作負載提供最佳性價比。現在,我們發現在同樣的模擬中,基於 Graviton3 的 C7g 執行個體比基於 Graviton2 的 C6g 執行個體快 40%。我們很高興 EFA 將成為此執行個體類型中的標配,基於 Graviton3 的執行個體在性價比方面的優異表現,我們期待它將成為執行所有 CFD 工作負載的最佳選擇。」
Epic Games 創立於 1991 年,是 Fortnite、Unreal、Gears of War、Shadow Complex 和Infinity Blade 系列遊戲的創造者。Epic 的 Unreal Engine 技術為 PC、主機、手機、AR、VR 和 Web 帶來高逼真、互動式的體驗。Epic Games 高級工程總監 Mark Imbriaco 表示:「當我們展望未來,為玩家建構更加沉浸和吸引人的體驗時,我們很高興使用基於 Amazon Gravtion3 處理器的 EC2 執行個體。我們的測試顯示,它們甚至適用於要求最嚴苛、延遲敏感度最高的工作負載,同時提供卓越的性價比,提升了《要塞英雄(Fortnite)》和任何基於虛擬引擎創造的遊戲體驗。」
Honeycomb 開發了一個視覺化平台,讓工程團隊可以視覺化、分析和改善雲端應用程式的品質和效能。Honeycomb.io 首席開發者佈道師 Liz Fong-Jones 表示:「我們很高興能夠基於 Amazon Graviton3 的預覽執行個體測試我們的高傳輸遙測取樣工作負載。在處理相同工作負載的情況下,我們執行的 C7g 執行個體比 C6g 少 30%、延遲降低 30%。我們期待 Amazon Graviton3 的 C7g 執行個體正式啟用後,盡快投入到我們的生產環境中。」
Meta AI 專注於將人們與其關心的事物聯繫起來,提供有意義且安全的體驗,推進機器學習並指導開放研究。Meta AI PyTorch 工程高級總監 Lin Qiao 表示:「PyTorch 開發人員不斷創新,以提高深度學習模型的準確性,並找到更好的方法解決問題。同時,這些模型的規模呈指數級增長,這讓訓練它們變得更加困難,成本更高。我們的PyTorch 團隊一直在與 Amazon Neuron 團隊合作,為易用性和效能設定了一個高標準,確保在 PyTorch 中為 Trainium 等加速器提供原生支援。這其中包括研究分散式訓練中的集體運算原語(Collective compute primitives),以及為擴展效能和分散式訓練設置適當的基礎。我們期待與 AWS 合作,將 Trainium 與 PyTorch 原生產品(如 eager mode和dynamic shapes)進行更多的整合。」
Anthropic 建構了可靠、可解釋和可操控的人工智慧系統,這些系統將有機會為商業和公共利益創造價值。Anthropic 聯合創辦人 Tom Brown 表示:「我們的研究興趣橫跨多個領域,包括自然語言、人類回饋、縮放定律、強化學習、代碼生成和可解釋性。我們成功的關鍵是利用現代基礎設施,讓我們可以啟動超超大的高效能深度學習加速器艦隊。我們期待使用 Amazon Trainium 晶片支援的 Trn1 執行個體,因為它們具有前所未有的能力,可以擴展到上萬個節點,還有更高的網路頻寬,這將讓我們可以在控制成本的同時更快地反覆運算。」
Splunk 是頂尖的資料平台供應商,旨在調查、監控、分析和處理任何規模的資料。Splunk 雲端平台和基礎設施副總裁 Brad Murphy 表示:「我們執行基於 C/C++ 的工作負載來索引和搜尋事件資料。我們的工作負載基於 CPU,並受益於高容量和低延遲的SSD 儲存。在評估由 Amazon Graviton2 支援的新 Im4gn/Is4gen 執行個體時,我們觀察到,與當前使用的 I3/I3en 執行個體相比,搜尋執行時間減少 50%。Im4gn 和 Is4gen 執行個體成為執行儲存密集型工作負載的絕佳選擇,性價比顯著提升且總體擁有成本(TCO)更低。」
Sprinklr 透過 30 多個數位化管道幫助世界上大型企業提升客戶滿意度——使用為企業建構的最先進、最複雜的人工智慧引擎來擬定以洞察力驅動的策略,創造更優秀的客戶體驗。Sprinklr 工程副總裁 Abhay Bansal 表示:「我們在由 Amazon Graviton2 處理器支援的 Amazon EC2 Im4gn/Is4gen 執行個體上對基於 Java 的搜尋工作負載進行基準測試。與較大的 I3en 執行個體相比,較小的 Is4gen 執行個體就能提供相似的效能,這代表有機會顯著降低 TCO。我們在將工作負載從 I3 執行個體遷移到 Im4gn 執行個體時,還發現查詢延遲顯著降低多達 50%,性價比提升 40%。遷移到基於Amazon Graviton2 的執行個體很輕鬆,完成基準測試只需要兩週時間。我們對現在的經驗感到非常滿意,並期待基於 Im4gn 和 Is4gen 執行個體在生產環境中執行這些工作負載。」
Redis Enterprise 透過幫助軟體團隊為即時世界創建高效能資料層,為全球超過 8,000 個組織提供關鍵任務應用程式和服務。Redis 聯合創辦人暨技術長 Yiftach Shoolman 表示:「我們非常高興看到,使用全新低延遲 Amazon Nitro SSDs 的 Amazon EC2 I4i 執行個體提供比上一代執行個體更快的交易速度。我們預計 I4i 執行個體更強的儲存效能和更快的網路與處理器速度,將為我們那些基於 I4i 執行個體使用 Redis-on-Flash 的客戶帶來顯著的改善。」
關於 Amazon Web Services
AWS 在超過 15 年以來,一直以技術創新、服務多元、應用廣泛而享譽業界。AWS 一直不斷擴展其服務以支援幾乎所有雲端工作負載,目前提供超過 200 項功能完善的服務,涵蓋運算、儲存、資料庫、網路、資料分析、機器學習與人工智慧、物聯網、行動、安全、混合雲、虛擬實境與擴增實境、媒體,以及應用開發、部署與管理等方面;基礎設施遍及 25 個地理區域內的81個可用區域(Availability Zone),並已公佈預計在澳洲、加拿大、印度、印尼、以色列、紐西蘭、西班牙、瑞士和阿拉伯聯合大公國新建 9 個區域及 27 個可用區域。包括發展迅速的新創公司、大型企業和政府機構在內,全球數百萬客戶都信賴 AWS,透過 AWS 的服務支撐其基礎設施、提高營運敏捷度並降低成本。欲瞭解更多資訊,請瀏覽:aws.amazon.com。