Amazon S3 現在支援 Apache Iceberg 資料表的排序和 Z 順序壓縮
張貼日期:
2025年6月24日
Amazon S3 現在支援 Apache Iceberg 資料表的排序和 z 順序壓縮功能,這些功能適用於使用 AWS Glue Data Catalog 最佳化的 Amazon S3 Tables 和一般用途 S3 儲存貯體。Iceberg 資料表中的排序壓縮可將查詢引擎掃描的資料檔案數量降至最低,從而改善查詢效能並降低成本。Z 順序壓縮能夠在同時跨多個資料欄進行查詢時,透過高效的檔案剪除功能來提供額外的效能優勢。
S3 Tables 提供完全受管的體驗,當在資料表中繼資料中定義排序順序時,系統會在壓縮期間將階層排序自動套用到資料欄上。當多個查詢述詞需要相同的優先權時,您可以透過 S3 資料表維護 API 啟用 z 順序壓縮。如果您在一般用途 S3 儲存貯體中使用 Iceberg 資料表,則可以在 AWS Glue Data Catalog 主控台啟用最佳化 (您可以在其中指定偏好的壓縮方法)。
這些額外的壓縮功能適用於所有提供 S3 Tables 或 AWS Glue Data Catalog 最佳化的 AWS 區域。若要進一步了解,請閱讀 AWS 新聞部落格,並瀏覽 S3 Tables 維護文件和 AWS Glue Data Catalog 最佳化文件。