I prezzi di Amazon Athena sono calcolati solo in base all'uso effettivo. Non sono previsti pagamenti anticipati, impegni minimi né contratti a lungo termine. Al termine di ogni mese saranno fatturati solo i costi per le risorse effettivamente utilizzate. 

Per iniziare, crea un gruppo di lavoro che ti consenta specificare il tuo motore di query, la directory di lavoro in Amazon Simple Storage Service (S3) che conterrà i risultati dell'esecuzione, i ruoli AWS Identity and Access Management (IAM) e i tag di risorse. Puoi utilizzare i gruppi di lavoro per separare utenti, team, applicazioni o carichi di lavoro; impostare limiti sulla quantità di dati che ciascuna query o l'intero gruppo di lavoro è in grado di elaborare e tenere traccia dei costi. A seconda del gruppo di lavoro creato, puoi (a) eseguire query basate su SQL e ricevere l'addebito in base al numero di byte scansionati o (b) eseguire il codice Python per Apache Spark e farti addebitare una tariffa oraria per l'esecuzione del codice.

Prezzo per query

Risparmia comprimendo, partizionando o convertendo i dati in un formato a colonne

Puoi risparmiare dal 30% al 90% sui costi di query e ottenere migliori prestazioni comprimendo, partizionando e convertendo i tuoi dati in formati a colonne.

Dettagli sui prezzi

Query basate su SQL utilizzando un editor di query editor o l'interfaccia della linea di comando AWS (AWS CLI) 

I costi addebitati dipendono dalla quantità di dati scansionati da ciascuna query. Per ridurre in modo significativo i costi e migliorare le prestazioni, puoi comprimere, partizionare o convertire i dati in un formato a colonne, perché queste operazioni consentono di ridurre la quantità di dati che Athena deve scansionare per eseguire una query.

I costi vengono addebitati in base al numero di byte scansionati da Athena, approssimati al MB intero più vicino; il volume minimo di dati per ciascuna query è di 10 MB. Non è previsto alcun costo per le istruzioni DDL (Data Definition Language) quali CREATE/ALTER/DROP TABLE, le istruzioni di gestione delle partizioni o le query con errori. I costi delle query annullate vengono addebitati in base alla quantità di dati scansionati.

La compressione dei dati consente ad Athena di scansionare una quantità inferiore di dati. La conversione dei dati in formati a colonne permette invece ad Athena di leggere solo le colonne necessarie per l'elaborazione. Athena supporta Apache ORC e Apache Parquet. Anche il partizionamento dei dati consente ad Athena di ridurre la quantità di dati in scansione. In questo modo si ottiene una riduzione dei costi e prestazioni ottimizzate. Nella console di Athena viene visualizzato il volume di dati scansionati da ciascuna query. Per i dettagli consulta l'esempio di prezzi qui sotto.

Prezzi per la query federata

I costi vengono addebitati in base al numero di byte scansionati da Athena, aggregati fra tutte le origini dati e approssimati al MB intero più vicino; il volume minimo di dati per ciascuna query è di 10 MB.

Esegui il codice Python per Apache Spark utilizzando notebook o l'Interfaccia della linea di comando AWS

Paghi solo in base al tempo necessario per l'esecuzione dell'applicazione Apache Spark. Viene applicata una tariffa oraria calcolata sul numero di unità di elaborazione dati (o DPU) utilizzate per eseguire l'applicazione Apache Spark. Una singola DPU fornisce 4 vCPU e 16 GB di memoria. La fatturazione prevede incrementi di 1 secondo, arrotondati al secondo più vicino.

Quando avvii una sessione Spark avviando un notebook nella console Athena o utilizzando l'API Athena, all'applicazione vengono allocati due nodi: un nodo notebook che fungerà da server per l'interfaccia utente del notebook e un nodo driver Spark che coordinerà l'applicazione Spark e comunicherà con tutti i nodi worker Spark. I nodi worker Spark sono responsabili dell'esecuzione delle attività dell'applicazione Spark. Dopo aver avviato una sessione, puoi eseguire un'applicazione Spark eseguendo le celle nel notebook o utilizzando l'API start-calculation-execution. Quando esegui un'applicazione Spark, Athena fornisce i nodi worker Spark necessari. I nodi worker vengono rilasciati al termine dell'esecuzione dell'applicazione. Poiché Athena per Apache Spark riduce automaticamente le risorse, Athena riduce al minimo le spese di inattività. Una volta finalizzata la sessione Spark, vengono rilasciati il driver, tutti i nodi worker e i nodi notebook. Athena addebiterà il costo dei nodi driver e worker per la durata della sessione. Athena fornisce notebook nella console come interfaccia utente per la creazione, l'invio e l'esecuzione di applicazioni Spark e offre questa funzionalità senza costi aggiuntivi. Athena non addebita costi per i nodi notebook utilizzati durante la sessione Spark.

Costi aggiuntivi

Athena esegue le query direttamente sui dati in Amazon S3. Non sono previsti costi aggiuntivi per l'esecuzione delle query con Athena. Saranno però addebitati i costi standard di S3 per archiviazione, richieste e trasferimento di dati. Per impostazione predefinita, i risultati delle query vengono memorizzati in un bucket S3 a scelta; anche per questi file vengono addebitate le tariffe standard di S3.

Se il catalogo dati AWS Glue viene utilizzato con Athena, saranno addebitate le tariffe standard del catalogo dati. Per saperne di più, visita la pagina dei prezzi di AWS Glue.

Saranno inoltre applicate le tariffe standard dei servizi AWS utilizzati con Athena quali, ad esempio, Amazon S3, AWS Lambda, AWS Glue e Amazon SageMaker. Per esempio, saranno addebitati i costi standard di S3 per archiviazione, richieste e trasferimento di dati tra regioni diverse. Per impostazione predefinita, i risultati delle query vengono memorizzati in un bucket S3 a scelta; anche per questi file vengono addebitate le tariffe standard di S3. Se utilizzi Lambda, i costi addebitati dipendono dal numero di richieste per le funzioni e la loro durata, l'intervallo di tempo necessario per l'esecuzione del codice.

Le query federate richiamano le funzioni Lambda nell'account e l'utilizzo di Lambda ti viene addebitato alle tariffe standard. Le funzioni Lambda richiamate dalle query federate sono soggette al piano gratuito di Lambda. Per saperne di più, visita la pagina dei prezzi di Lambda.

Esempio di prezzi

Esempio 1: query SQL

Supponiamo di avere una tabella con 4 colonne di dimensioni equivalenti, memorizzata in Amazon S3 come file di testo non compresso delle dimensioni totali di 3 TB. Per eseguire una query su una singola colonna della tabella, Amazon Athena dovrà scansionare l'intero file, perché i formati di testo non possono essere divisi.

  • Il costo di questa query sarebbe di 15 USD. (Il prezzo per 3 TB scansionati è di 3 X 5 USD/TB = 15 USD)

Se comprimi il file con GZIP, il rapporto di compressione può essere di 3:1. In questo caso, la scansione sarebbe solo su un file di 1 TB. La stessa query sul file compresso costerebbe 5 USD. Athena scansionerà comunque l'intero file, ma poiché le dimensioni sono tre volte inferiori, sarà addebitato solo un terzo della prima scansione. Se comprimi il file e lo converti in un formato a colonne, ad esempio Apache Parquet, ottieni un'ulteriore compressione con rapporto 3:1, senza modificare lo spazio occupato in S3 (1 TB). In questo caso, però, siccome Parquet adotta un formato a colonne, Athena può leggere solo la colonna interessata dalla query in esecuzione. Nel nostro caso, la query farà riferimento a una sola colonna, però Athena dovrà leggere solo la colonna in questione e potrà ignorare tre quarti del file. Athena scansionerà quindi solo un quarto del file, equivalente a 0,25 TB di dati in S3.

  • Il costo di questa query sarebbe di 1,25 USD. La compressione e la lettura di una sola colonna comporta rispettivamente un risparmio di 3 e 4 volte superiore. 
    (Dimensioni del file = 3 TB /3 = 1 TB. Dati scansionati per una colonna singola = 1 TB /4 = 0,25 TB. Prezzo per 0,25 TB = 0,25 * 5 USD/TB = 1,25 USD)

Esempio 2: applicazione Apache Spark

Supponiamo di utilizzare un notebook nella console di Athena per estrarre i dati di vendita relativi al trimestre precedente e tracciarli su un grafico per creare un report. Avvii una sessione utilizzando un notebook. La sessione dura 1 ora e prevede la presentazione di 6 calcoli. Ogni calcolo richiede 20 nodi worker da 1-DPU per l'esecuzione e dura 1 minuto.

  • DPU/ora worker = numero di calcoli * DPU utilizzate per i calcoli * tempo di esecuzione del calcolo = 6 calcoli * 20 DPU per calcolo * (1/60) ore per calcolo = 2 DPU/ora
  • DPU/ora driver = DPU utilizzate per sessione * tempo di sessione = 1 DPU per sessione * 1 ora per sessione = 1 DPU/ora
  • Totale DPU/ora = DPU/ora worker + DPU/ora driver = 2 DPU/ora + 1 DPU/ora = 3 DPU/ora
  • Costi dell'applicazione Spark = 0,35 USD per DPU/ora * 3 DPU/ora = 1,05 USD

Nota: i costi di S3 per l'archiviazione e la lettura dei dati e per i risultati dell'esecuzione saranno addebitati separatamente.

Risorse aggiuntive sui prezzi

Calcolatore di prezzi di AWS

Calcola facilmente le spese mensili con AWS

Ottieni assistenza sui prezzi

Contatta gli specialisti AWS per ricevere un preventivo personalizzato

Visita la pagina sulle nozioni di base

Scopri come iniziare a usare Amazon Athena.

Ulteriori informazioni »
Inizia subito nella console

Inizia subito a utilizzare Amazon Athena nella Console di gestione AWS.

Accedi »
Contatta un esperto

Scopri le opzioni di supporto di Amazon Athena.

Contattaci »