Amazon Redshift 现在支持对 Apache Iceberg 表进行即时分析

发布于: 2025年11月18日

Amazon Redshift 今天宣布全面推出对 Apache Iceberg 表的即时分析功能,让用户能够对 Redshift 数据湖中的 Apache Iceberg 表执行高性能读写分析查询。Apache Iceberg 是一种开放表格式,已被许多客户用来简化存储在数据湖中的快速扩展和不断演变的表中数据的处理。

与传统数据仓库不同,数据湖通常缺乏底层数据的表级和列级统计数据,在缺乏这些统计数据的情况下,查询引擎难以选择最优的查询执行计划。次优的查询执行计划可能会导致性能变慢且不可预测。

“即时分析”是 Amazon Redshift 的一项新功能,可在查询执行期间自动收集和利用 Iceberg 表的统计信息,无需手动收集统计数据,同时为查询引擎提供生成最佳查询执行计划所需的信息。该系统使用智能启发式方法来识别将从统计数据中受益的查询,可以维护轻量级草图数据结构,并构建高质量的表级和列级统计数据。即时分析可以直接提供与预先计算统计信息的查询相当的性能,并为更多性能优化奠定基础。

针对 Apache Iceberg 表的 Amazon Redshift 即时分析功能现已在支持 Amazon Redshift 的所有 AWS 区域推出。用户无需进行任何更改或启用任何设置即可利用这种新的数据湖查询优化功能。要开始使用,请访问 Amazon Redshift 管理指南的文档页面。