发布于: May 15, 2020

Amazon Redshift 现在可利用 Bloom 筛选器实现轻松、高效的数据筛选,从而使 Amazon S3 上的外部表上的查询性能提高高达 2 倍。Bloom 筛选器是一个内存高效的概率数据结构,它通过筛选与联合关系不匹配的行来大规模加快联合查询,从而大幅减少通过网络传输的数据量。Amazon Redshift 可自动确定哪些查询适合在查询运行时利用 Bloom 筛选器。您可以通过 Amazon Redshift Spectrum 构建一个湖库架构,以直接查询和联合数据仓库和数据湖中的数据,从而获得前所未有的见解。 

在 Amazon Redshift Spectrum 可用的 AWS 区域中,发行版本 1.0.15503 或更高版本默认已启用 Amazon Redshift Bloom 筛选器。有关更多信息,请访问文档。请参阅 AWS 区域表,了解 Amazon Redshift 的可用情况。