Amazon EMR Serverless 消除了 Apache Spark 工作負載的本機儲存佈建需求

張貼日期: 2025年12月2日

Amazon EMR Serverless 現在提供無伺服器儲存,免除了 Apache Spark 工作負載的本機儲存佈建需求,可降低高達 20% 的資料處理成本,並防止因磁碟容量限制導致的作業失敗。您不再需要為每個應用程式設定本機磁碟類型與大小。EMR Serverless 會自動處理中介資料作業 (例如隨機),且不收取本機儲存費用。您只需為作業所使用的運算與記憶體資源付費。

EMR Serverless 會將中介資料作業卸載至完全受管、可自動擴展的無伺服器儲存裝置,該儲存裝置會提供傳輸中的資料與靜態資料加密,並實現作業層級隔離。無伺服器儲存裝置將儲存與運算分離,使 Spark 能在閒置時立即釋放工作節點,而不必為了保留暫存資料而保持工作節點持續運作。它消除了因磁碟容量不足導致的作業失敗,並透過避免閒置工作節點費用來降低成本。這對使用動態資源配置的作業特別有價值,例如處理數百萬筆客戶互動的推薦引擎,其初始階段會以高平行度處理大型資料集,接著在資料彙整時縮小規模。

此功能在 EMR 版本 7.12 及以上版本正式推出。請參閱支援的 AWS 區域,以了解供應情況。若要開始使用,請參閱 EMR Serverless 的無伺服器儲存裝置文件。