Amazon Athena per Apache Spark

Esegui un'analisi interattiva su Apache Spark in meno di un secondo

Perché Athena su Apache Spark?

Inizia a usare l'analisi interattiva in meno di un secondo su Amazon Athena per Apache Spark in modo da analizzare petabyte di dati. Le applicazioni Spark interattive si avviano istantaneamente e funzionano più velocemente grazie al nostro runtime Spark ottimizzato, così puoi dedicare più tempo agli approfondimenti senza perdere tempo ad attendere i risultati. Crea applicazioni Spark avvalendoti dell'espressività di Python con un'esperienza per notebook semplificata in una console Athena o tramite le API Athena. Grazie al modello Athena serverless completamente gestito, non c'è bisogno di gestire, fornire e configurare risorse e non vi sono tariffe minime o costi di installazione. Paghi solo in base al tempo di query.

Vantaggi

Dedica più tempo agli approfondimenti, anziché all'attesa dei risultati. Le applicazioni Spark interattive si avviano in meno di un secondo e funzionano più velocemente grazie al runtime Spark ottimizzato.
Utilizza l'espressività di Python con il popolare framework open source di Spark per ricavare approfondimenti più complessi dai dati. Utilizza notebook per eseguire query sui dati, concatenare calcoli e visualizzare i risultati.
Esegui applicazioni Spark a costi contenuti, senza effettuare il provisioning e la gestione delle risorse. Crea applicazioni Spark senza bisogno di occuparti delle relative configurazioni o degli aggiornamenti di versione.
Lavora con i dati in vari data lake, in formati di dati aperti e con le tue applicazioni aziendali, senza bisogno di spostarli. Utilizza i dati rilevati e classificati da AWS Glue per creare approfondimenti Spark.

Casi d'uso

Usare Athena e AWS Glue per esplorare i set di dati e lavorare con i dati. 

Visualizza vari formati e set di dati insieme per generare approfondimenti.

Crea applicazioni SaaS che utilizzano Athena per Apache Spark per lavorare in modo interattivo con i dati.

Esplora i datastore per generare campioni di set di dati e per la generazione di funzionalità interattive.