发布于: May 15, 2020
Amazon Redshift 现在可利用 Bloom 筛选器实现轻松、高效的数据筛选,从而使 Amazon S3 上的外部表上的查询性能提高高达 2 倍。Bloom 筛选器是一个内存高效的概率数据结构,它通过筛选与联合关系不匹配的行来大规模加快联合查询,从而大幅减少通过网络传输的数据量。Amazon Redshift 可自动确定哪些查询适合在查询运行时利用 Bloom 筛选器。您可以通过 Amazon Redshift Spectrum 构建一个湖库架构,以直接查询和联合数据仓库和数据湖中的数据,从而获得前所未有的见解。