Inserito il: Jun 26, 2020
Amazon Athena ha aggiunto il supporto per la proiezione delle partizioni, una nuova funzionalità che permette di accelerare l'elaborazione delle query di tabelle altamente partizionate e di automatizzare la gestione delle partizioni.
Durante l'elaborazione delle query, Athena recupera le informazioni sui metadati dallo store di metadati, come per esempio il Catalogo dati di AWS Glue o Hive Metastore, prima di eseguire la ripartizione. Se le tabelle possiedono un numero elevato di partizioni, il recupero dei metadati può richiedere molto tempo. Per evitare di dedicare troppo tempo a questa operazione, puoi utilizzare la proiezione delle partizioni. La proiezione delle partizioni consente di specificare delle informazioni di configurazione, come i modelli (ad esempio AAAA/MM/GG), che vengono comunemente utilizzate per la creazione delle partizioni. Questo offre ad Athena le informazioni necessarie per creare le partizioni senza necessità di recuperare le informazioni sui metadati dallo store di metadati. Athena leggerà i valori e le posizioni delle partizioni dalla configurazione anziché da un repository come il Catalogo dati di AWS Glue. La proiezione delle partizioni riduce il runtime delle query per le tabelle altamente partizionate, poiché le operazioni in memoria sono spesso più veloci delle operazioni in remoto.
Consulta la nostra documentazione per ottenere informazioni dettagliate ed esempi di utilizzo.