Amazon Redshift rende disponibile al pubblico il layout di dati multidimensionali
Amazon Redshift rende disponibile al pubblico il layout dati multidimensionale (MDDL) che ordina dinamicamente i dati in base a filtri di query reali, garantendo prestazioni delle query più veloci. A differenza dei metodi di ordinamento tradizionali che ordinano i dati in base a colonne fisse, MDDL ordina i dati in base a filtri di query (ad esempio, vendite in US), raggiungendo prestazioni end-to-end fino a 10 volte superiori rispetto all'uso esclusivo di chiavi di ordinamento ottimali a singola colonna per carichi di lavoro con filtri di query ricorrenti.
Per ogni tabella con una chiave di ordinamento AUTO, che è l'impostazione predefinita per le tabelle senza una chiave di ordinamento esplicita, Redshift analizza la cronologia delle query della tabella e seleziona automaticamente una chiave di ordinamento a colonna singola o MDDL per la tabella, a seconda dei potenziali miglioramenti delle prestazioni per il carico di lavoro. Redshift con MDDL crea automaticamente una chiave di ordinamento virtuale multidimensionale che colloca insieme le righe a cui normalmente si accede dalle stesse query. Questa colonna virtuale, equivalente a una nuova chiave di ordinamento per la tabella, viene successivamente utilizzata durante l'esecuzione della query per saltare i blocchi di dati e persino saltare la scansione di intere colonne del predicato. Redshift con MDDL fornisce una generalizzazione più espressiva delle chiavi di ordinamento composte e intercalate esistenti, migliorando significativamente le prestazioni delle scansioni delle tabelle, soprattutto quando il carico di lavoro delle query contiene filtri di query ricorrenti. Per le tabelle preesistenti con chiavi di ordinamento definite manualmente, è possibile sfruttare MDDL modificando la chiave di ordinamento della tabella in AUTO.
MDDL è disponibile in tutte le regioni AWS commerciali in cui viene offerto Redshift. Per iniziare e per saperne di più sui benchmark sui miglioramenti delle prestazioni delle query, consulta la documentazione, il blog e la pubblicazione di Amazon Science.