Publié le: Apr 13, 2023
Aujourd'hui, Amazon Redshift a introduit des améliorations de performances supplémentaires qui accélèrent le traitement des données basé sur des chaînes de 5 à 63 fois par rapport aux codages de compression alternatifs tels que LZO ou ZSTD. Amazon Redshift y parvient grâce à des scans vectorisés sur des colonnes de chaîne légères codées dans un dictionnaire et économes en ressources processeur, qui permettent au moteur de base de données de fonctionner directement sur les données compressées. Ces techniques sont optimales sur les colonnes de chaînes de faible cardinalité (CHAR ou VARCHAR). Les colonnes de chaînes à faible cardinalité sont des colonnes qui contiennent jusqu'à quelques centaines de valeurs de chaîne uniques.
Vous pouvez automatiquement bénéficier de cette nouvelle amélioration des performances élevées en activant l'optimisation automatique des tables (ATO) dans votre entrepôt des données Amazon Redshift. Si l'ATO n'est pas activé sur vos tables, vous pouvez recevoir des recommandations d'Amazon Redshift Advisor sur la console Amazon Redshift concernant l'adéquation d'une colonne de chaîne au codage BYTEDICT. Vous pouvez également définir de nouvelles tables comportant des colonnes de chaînes de faible cardinalité avec le codage BYTEDICT. Les améliorations apportées aux chaînes dans Amazon Redshift sont désormais disponibles dans toutes les régions Amazon Web Services (AWS) où Amazon Redshift est disponible.