Publicado en: May 15, 2020
A partir de ahora, Amazon Redshift saca partido de los filtros de Bloom para hacer posible un filtrado de datos temprano y eficaz que puede duplicar el rendimiento de consulta de tablas externas en Amazon S3. Un filtro de Bloom es una estructura de datos probabilísticos de memoria eficiente que acelera la unión de consultas a escala al filtrar filas que no coinciden con la relación de unión, de modo que se reduce notablemente la cantidad de datos transferidos a través de la red. Amazon Redshift determina de forma automática qué consultas pueden beneficiarse de los filtros de Bloom durante su tiempo de ejecución. Puede potenciar la arquitectura de un lago de datos con Amazon Redshift Spectrum para consultar y unir datos directamente en almacenes y lagos de datos, lo que le permite obtener una visión única que no sería posible de otro modo.
Los filtros de Bloom para Amazon Redshift están habilitados de forma predeterminada en la versión 1.0.15503 o posterior, en aquellas regiones de AWS donde Amazon Redshift Spectrum está disponible. Para obtener más información, consulte la documentación. Consulte la tabla de regiones de AWS para conocer la disponibilidad de Amazon Redshift.