Publié le: May 15, 2020
Amazon RedShift utilise maintenant les filtres Bloom pour permettre le filtrage anticipé et efficace des données pour des performances de requêtes jusqu’à 2x plus rapides sur les tables externes dans Amazon S3. Un filtre Bloom est une structure de données probabiliste et efficace en mémoire qui accélère les requêtes conjointes à l’échelle en filtrant les rangées qui ne correspondent pas à la relation conjointe, réduisant significativement le volume de données transférées via le réseau. Amazon RedShift détermine automatiquement les requêtes qui conviennent à l’utilisation de filtres Bloom à l’exécution de la requête. Vous pouvez alimenter une architecture de lake house avec Amazon Redshift Spectrum afin d’effectuer une requête et de rejoindre des données directement dans votre entrepôt de données et votre lac de données, ce qui vous permet d’obtenir des informations exclusives que vous ne pourriez obtenir autrement.
Les filtres Bloom d’Amazon RedShift sont activés par défaut avec la version 1.0.15503 ou ultérieure dans les régions AWS où Amazon RedShift Spectrum est disponible. Pour plus d'informations, reportez-vous à la documentation. Consultez le tableau des régions AWS pour obtenir des informations sur la disponibilité d'Amazon Redshift.