Publicado: Apr 13, 2023
Hoje, o Amazon Redshift introduziu aprimoramentos adicionais de performance que aceleram o processamento de dados baseado em strings de 5 a 63 vezes em comparação com codificações de compressão alternativas como LZO ou ZSTD. O Amazon Redshift consegue isso por meio de escaneamentos vetorizados em colunas de string leves, codificadas por dicionário e com uso eficiente de CPU. Esses recursos permitem que o mecanismo de banco de dados opere diretamente sobre dados compactados. Essas técnicas são ideais em colunas de strings de baixa cardinalidade (CHAR ou VARCHAR). As colunas de strings de baixa cardinalidade têm até algumas centenas de valores únicos de strings.
Você pode se beneficiar automaticamente desse novo aprimoramento de strings de alta performance ativando a otimização automática de tabelas (ATO) em data warehouses do Amazon Redshift. Se a ATO não estiver ativada nas tabelas, você poderá receber recomendações do Amazon Redshift Advisor no console do Amazon Redshift sobre a adequação de uma coluna de strings para a codificação BYTEDICT. Você também pode definir novas tabelas com colunas de strings de baixa cardinalidade com a codificação BYTEDICT. Agora, os aprimoramentos de strings no Amazon Redshift estão disponíveis em todas as regiões da Amazon Web Services (AWS) em que o Amazon Redshift é oferecido.