Amazon EMR 宣布推出 S3A 作為預設連接器

張貼日期: 2025年8月29日

AWS 宣布推出 Amazon EMR S3A,這是一款全新的 Amazon S3 連接器,可優化 Amazon EMR 上的 Apache Hadoop、Apache Spark 和 Apache Hive 工作負載效能。這個新的連接器透過 AWS 專屬的最佳化增強開放原始碼 S3A 架構,幫助組織更高效地處理大規模的資料。EMR S3A 支援 S3 Express One Zone、S3 Glacier 和 AWS Outposts 的直接整合,可幫助客戶運用 AWS 中的不同儲存選項,同時優化 EMR 工作負載的資料存取速度和儲存成本。

此外,EMR S3A 連接器還提供進階安全功能和效能功能,對開放原始碼 S3A 進行額外擴充。主要改進包括 Apache Spark 內建更精細的存取控制支援、增強的 S3A 憑證解析器、用於最佳化檔案寫入的 MagicCommitter V2,以及針對單欄式檔案格式的加速 S3 前綴列舉。這些增強功能從 EMR 版本 7.10 開始提供,並維持與現有應用程式的相容性。


Amazon EMR S3A 連接器適用於所有提供 Amazon EMR 的 AWS 區域,並且已預先設定 Amazon EMR 版本 7.10 及更高版本。若要進一步了解 Amazon EMR S3A,請參閱 Amazon EMR 文件