Amazon EMR 7.12 現在支援 Apache Iceberg v3 資料表格式
張貼日期:
2025年11月21日
Amazon EMR 7.12 版現已推出,該版本採用新的 Apache Iceberg v3 資料表格式和 Apache Iceberg 1.10 版。此版本可讓您在刪除資料時降低成本、透過更好的資料列層級變更追蹤來加強治理和合規性,並藉由更精細的資料存取控制來增強資料安全性。
有了 Iceberg v3,您就能以具成本效益的方式刪除資料,因為 Iceberg v3 會標記已刪除的資料列而無需重寫整個文件,這會加速您的資料管道,同時降低儲存成本。透過自動追蹤每個資料列的建立和修改歷史記錄、建立法規要求所需的稽核軌跡,以及變更資料擷取,能夠讓您獲得更好的治理和合規性功能。您可以藉由資料表層級加密來增強資料安全性,協助您滿足最敏感資料的相關隱私權法規。
此版本包含 Apache Spark 3.5.6,因此您能夠利用這些 Iceberg 1.10 功能,在 Amazon S3 上建立強大的資料湖倉架構。此版本還包括使用 AWS Lake Formation 跨 Iceberg 資料表的資料治理作業支援。此外,此版本還包含 Apache Trino 476。
Amazon EMR 7.12 適用於支援 Amazon EMR 的所有 AWS 區域。若要進一步了解Amazon EMR 7.12 版本,請瀏覽 Amazon EMR 7.12 版本文件。