Publicado: May 15, 2020
O Amazon Redshift agora utiliza filtros Bloom para possibilitar a filtragem antecipada e eficaz e assim duplicar a performance das consultas nas tabelas externas no Amazon S3. Um filtro Bloom é uma estrutura de dados probabilística que utiliza pouca memória e acelera consultas agrupadas em grande escala, pois filtra as linhas que não correspondem à relação de agrupamento, o que reduz consideravelmente o volume de dados transferidos pela rede. O Amazon Redshift determina automaticamente quais consultas são adequadas para utilizar filtros Bloom no tempo de execução da consulta. Você pode capacitar uma arquitetura de lake house com o Amazon Redshift Spectrum para consultar e agrupar dados diretamente no data warehouse e no data lake. Com isso, você ganha informações únicas que não seriam possíveis de outra maneira.
Os filtros Bloom do Amazon Redshift são ativados por padrão com a versão 1.0.15503 ou posterior nas regiões da AWS em que o Amazon Redshift Spectrum está disponível. Obtenha mais informações na documentação. Consulte a Tabela de regiões da AWS para saber mais sobre a disponibilidade do Amazon Redshift.