Veröffentlicht am: Apr 13, 2023
Heute hat Amazon Redshift zusätzliche Leistungsverbesserungen eingeführt, die die Verarbeitung von String-basierten Daten im Vergleich zu alternativen Kompressionskodierungen wie LZO oder ZSTD um das 5- bis 63-fache beschleunigen. Amazon Redshift erreicht dies durch vektorisierte Scans über einfache, CPU-effiziente, wörterbuchkodierte String-Spalten, durch die Datenbank-Engine unmittelbar mit komprimierten Daten arbeiten kann. Diese Techniken sind optimal für String-Spalten mit geringer Kardinalität (CHAR oder VARCHAR). String-Spalten mit geringer Kardinalität sind Spalten, die bis zu einigen hundert eindeutige String-Werte haben.
Sie können automatisch von dieser neuen leistungsstarken String-Erweiterung profitieren, indem Sie die automatische Tabellenoptimierung (ATO) in Ihrem Amazon-Redshift-Data-Warehouse aktivieren. Wenn Sie ATO nicht für Ihre Tabellen aktiviert haben, können Sie vom Amazon Redshift Advisor in der Amazon-Redshift-Konsole Empfehlungen erhalten, ob eine String-Spalte für die BYTEDICT-Kodierung geeignet ist. Sie können außerdem neue Tabellen definieren, die String-Spalten mit geringer Kardinalität und BYTEDICT-Kodierung enthalten. String-Erweiterungen in Amazon Redshift sind jetzt in allen Amazon Web Services (AWS)-Regionen verfügbar, in denen Amazon Redshift verfügbar ist.