Il Catalogo dati AWS Glue supporta ora l'ottimizzazione automatica delle tabelle di Apache Iceberg tramite Amazon VPC

Inserito il: 21 nov 2024

Catalogo dati AWS Glue supporta ora l'ottimizzazione automatica delle tabelle Apache Iceberg a cui è possibile accedere solo da uno specifico ambiente Amazon Virtual Private Cloud (VPC). Puoi abilitare l'ottimizzazione automatica fornendo una configurazione VPC per ottimizzare lo storage e migliorare le prestazioni delle query mantenendo le tabelle sicure.

Catalogo dati AWS Glue supporta la compattazione, la conservazione degli snapshot e la gestione dei file senza riferimenti che aiutano a ridurre il sovraccarico dei metadati, a controllare i costi di storage e a migliorare le prestazioni delle query. I clienti con configurazioni di governance e sicurezza che richiedono che un bucket Amazon S3 si trovi all'interno di un VPC specifico, possono ora utilizzarlo con Catalogo Glue. Ciò offre funzionalità più ampie per la gestione automatica dei dati Apache Iceberg, indipendentemente da dove sono archiviati su Amazon S3.

L'ottimizzazione automatica per le tabelle Iceberg tramite Amazon VPC è disponibile in 13 regioni AWS: Stati Uniti orientali (Virginia settentrionale, Ohio), Stati Uniti occidentali (Oregon), Europa (Irlanda, Londra, Francoforte, Stoccolma), Asia Pacifico (Tokyo, Seoul, Mumbai, Singapore, Sydney), Sud America (San Paolo). I clienti possono abilitarlo tramite la console AWS, l'AWS CLI o gli AWS SDK.

Per iniziare, ora puoi fornire la connessione di rete Glue come configurazione aggiuntiva insieme a impostazioni di ottimizzazione come il periodo di conservazione predefinito e i giorni per conservare i file senza riferimenti. Il Catalogo dati AWS Glue utilizzerà le informazioni VPC nella connessione Glue per accedere ai bucket Amazon S3 e ottimizzare le tabelle Apache Iceberg.
Per saperne di più, leggi il blog e visita la documentazione del Catalogo dati AWS Glue.