发布于: Apr 13, 2023

今天,Amazon Redshift 推出了额外的性能增强功能,与 LZO 或 ZSTD 等替代压缩编码相比,基于字符串的数据处理速度提高了 5 倍至 63 倍。Amazon Redshift 通过在轻量级 CPU 高效字典编码的字符串列上进行矢量扫描来实现这一点,这使得数据库引擎可以直接对压缩数据执行操作。这些技术最适合用于低基数字符串列(CHAR 或 VARCHAR)。低基数字符串列指的是拥有最多几百个唯一字符串值的列。

通过在 Amazon Redshift 数据仓库中启用自动表优化 (ATO),您可以自动从这一新的高性能字符串增强功能中获益。如果您的表未启用 ATO,您可以从 Amazon Redshift 控制台中的 Amazon Redshift Advisor 那里获得有关字符串列是否适合 BYTEDICT 编码的建议。您也可以定义新的表,这些表具有使用 BOTTEDICT 编码的低基数字符串列。Amazon Redshift 中的字符串增强功能现已在提供 Amazon Redshift 的所有 Amazon Web Services (AWS) 区域中推出。