Inserito il: Dec 4, 2018
I clienti possono ora generare ireport di inventario S3 in un formato di file Apache Parquet. L'inventario Amazon S3 fornisce un elenco di file flat di oggetti e di metadata selezionati per il tuo bucket o per i tuoi prefissi condivisi. È possibile utilizzare l’inventario S3 per elencare e generare report sullo stato degli oggetti o semplificare e accelerare i flussi di lavoro aziendali e le operazioni con i Big Data.
Parquet è un formato di file di storage colonnare simile a quello Optimized Row Columnar (ORC) ed è disponibile per qualsiasi progetto nell'ecosistema Hadoop indipendentemente dalla scelta del framework di elaborazione di dati, modello o linguaggio di programmazione. Il formato colonnare permette di leggere, decomprimere ed elaborare solo le colonne necessarie per la query in corso. Per effettuare query di inventario S3 con servizi AWS come Amazon Athena o Amazon Redshift Spectrum, o strumenti come Apache Hive, Spark, HBase o Presto, ti consigliamo di configurare il report di Inventario S3 in Parquet o ORC per prestazioni di query più veloci e a costi più bassi.
Il formato Parquet per l’inventario S3 è disponibile in tutte le regioni commerciali AWS e AWS GovCloud. Per iniziare subito, visita la Console di gestione AWS o utilizza l’API S3, l’interfaccia a riga di comando o il kit SDK per configurare l’inventario S3.