AWS 宣佈 Amazon S3 Tables,針對分析工作負載最佳化的全受管 Apache Iceberg 資料表

張貼日期: 2024年12月3日

Amazon S3 Tables 可提供首個具有內建 Apache Iceberg 支援的雲端物件存放區,這也是大規模儲存表格式資料的最簡便方式。S3 Tables 針對分析工作負載進行了專門的最佳化作業,相較於自我管理資料表,查詢輸送量最高可提升至 3 倍,且每秒交易量高達 10 倍。有了適用於 Apache Iceberg 標準的 S3 Tables 支援,常用的 AWS 和第三方查詢引擎即可輕鬆查詢您的表格式資料。此外,S3 Tables 是針對執行持續性的資料表維護而設計,即使在資料湖經過擴展和發展的情況下,依然會隨著時間自動將查詢效率和儲存成本最佳化。 S3 Tables 與 AWS Glue Data Catalog 的整合目前處於預覽階段,可讓您使用 AWS Analytics 服務 (例如 Amazon Data Firehose、Athena、Redshift、EMR 和 QuickSight) 來串流、查詢和視覺化資料 (包括 S3 中繼資料資料表)。

S3 Tables 導入了資料表儲存貯體,這是一種專為儲存表格式資料而建置的新儲存貯體類型。有了資料表儲存貯體,您就可以快速建立資料表並設定資料表層級的權限,進而管理資料湖的存取權。然後,您可以使用標準 SQL 來載入和查詢資料表中的資料,並套用 Apache Iceberg 的進階分析功能 (例如資料列層級交易、可查詢快照、結構描述演進等)。資料表儲存貯體還提供政策導向的資料表維護功能,可協助您自動執行作業任務 (例如壓縮、快照管理和未參考檔案移除)。

Amazon S3 Tables 現已適用於美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域,並且即將在其他區域推出。 如需訂價詳細資訊,請瀏覽 S3 定價頁面。若要進一步了解,請瀏覽產品頁面文件AWS 新聞部落格