Amazon Redshift ora supporta Just-In-Time (JIT) ANALYZE per le tabelle Apache Iceberg
Oggi Amazon Redshift rende disponibile al pubblico la funzionalità ANALYZE Just-In-Time (JIT) per tabelle Apache Iceberg, permettendo di eseguire query analitiche ad alte prestazioni in lettura e scrittura su tabelle Apache Iceberg nel data lake Redshift. Il formato open table Apache Iceberg è stato adottato da molti clienti per semplificare l'elaborazione dei dati su tabelle in rapida espansione e evoluzione conservate nei data lake.
A differenza dei data warehouse tradizionali, i data lake spesso non dispongono di statistiche complete sui dati sottostanti a livello di tabella e colonna, rendendo difficile per i motori di query la scelta dei piani di esecuzione ottimali in assenza di visibilità sulle statistiche delle tabelle e delle colonne. Piani di esecuzione delle query non ottimali possono comportare prestazioni più lente e meno prevedibili.
"JIT ANALYZE" è una nuova funzionalità di Amazon Redshift che raccoglie e utilizza automaticamente le statistiche per le tabelle Iceberg durante l'esecuzione delle query, eliminando la necessità di raccolta manuale delle statistiche e fornendo al motore di query le informazioni necessarie per generare piani di esecuzione ottimali. Il sistema utilizza euristiche intelligenti per identificare le query che possono trarre vantaggio dalle statistiche, mantiene strutture dati sketch leggere e genera statistiche di alta qualità a livello di tabella e colonna. JIT ANALYZE offre prestazioni immediate paragonabili a quelle delle query con statistiche pre-calcolate, costituendo al contempo la base per numerose altre ottimizzazioni delle prestazioni.
La funzionalità JIT ANALYZE di Amazon Redshift per le tabelle Apache Iceberg è ora disponibile in tutte le regioni AWS in cui è accessibile Amazon Redshift. Non è necessario apportare modifiche o abilitare impostazioni per sfruttare questa nuova ottimizzazione delle query sui data lake. Per iniziare, consulta la pagina della documentazione nella guida alla gestione di Amazon Redshift.