Bei Amazon Athena zahlen Sie nur für die Abfragen, die Sie tatsächlich ausführen. Dabei richtet sich die Gebühr nach der Menge der pro Abfrage durchsuchten Daten. Erhebliche Kosten können Sie sich sparen – bei großen Leistungsgewinnen –, wenn Sie Ihre Daten komprimieren, partitionieren oder in ein Spaltenformat konvertieren, denn jedes dieser Verfahren reduziert die Menge der Daten, die Athena während einer Abfrage durchsuchen muss.

Amazon Athena ist nun allgemein verfügbar.

Erste Schritte mit Amazon Athena
  • 5 USD pro durchsuchten TB.  

Sie sparen sich 30 % bis 90 % Ihrer Abfragekosten und erhalten eine bessere Leistung, wenn Sie Ihre Daten vor der Abfrage komprimieren, partitionieren und in ein Spaltenformat konvertieren.

Die Gebühren berechnen sich aus der Anzahl der von Amazon Athena durchsuchten Byte, gerundet auf Megabyte, wobei pro Abfrage mindestens 10 MB berechnet werden. Für Data Definition Language-Anweisungen (DDL) wie CREATE, ALTER oder DROP TABLE, Anweisungen für die Verwaltung von Partitionen oder fehlgeschlagene Abfragen werden keine Gebühren berechnet. Für abgebrochene Abfragen werden Gebühren auf Basis der bereits durchsuchten Datenmenge berechnet.

Durch Komprimierung Ihrer Daten verringern Sie die Menge der von Athena durchsuchten Daten. Durch Konvertierung Ihrer Daten in ein Spaltenformat erreichen Sie, dass Athena zur Verarbeitung der Daten nur die relevanten Spalten einlesen muss. Athena unterstützt Apache ORC und Apache Parquet. Auch durch Partitionierung Ihrer Daten erreichen Sie, dass Athena die Menge der durchsuchten Daten reduzieren kann. Dadurch sparen Sie Geld und steigern die Leistung. Die Menge der pro Abfrage durchsuchten Daten wird auf der Athena-Konsole angezeigt. Weitere Informationen hierzu finden Sie im Preisbeispiel für Athena.

Amazon Athena fragt die Daten direkt aus Amazon S3 ab. Für die Abfrage Ihrer Daten mit Athena fallen keine zusätzlichen Speichergebühren an. Für die Nutzung von Amazon S3 werden Ihnen die Standardtarife von S3 für Speicher, Anforderungen und Datenübertragung berechnet. Die Abfrageergebnisse werden standardmäßig in einem S3-Bucket Ihrer Wahl gespeichert, der ebenfalls zu den Standardtarifen von Amazon S3 berechnet wird.

Wenn Sie den AWS Glue-Datenkatalog mit Athena verwenden, werden die Standardraten des AWS Glue-Datenkatalogs berechnet. Klicken Sie hier, um mehr darüber zu erfahren.

Beispiel: Eine Tabelle mit drei gleich großen Spalten, gespeichert als nicht komprimierte Textdatei, mit einer Gesamtgröße von 3 TB auf Amazon S3. Für eine Abfrage der Daten aus nur einer Spalte muss Amazon Athena die gesamte Datei durchsuchen, da Textformate nicht teilbar sind.

  • Diese Abfrage kostet: 15 USD. (Preis für drei 3 TB durchsuchter Daten: 3 * 5 USD/TB = 15 USD)

Wenn Sie diese Datei mit GZIP in einem Verhältnis von 3:1 komprimieren, erhalten Sie eine komprimierte Datei mit einer Größe von 1 TB. Die gleiche Abfrage würde dann nur noch 5 USD kosten. Auch hier muss Athena die gesamte Datei durchsuchen. Da sich ihre Größe aber auf ein Drittel reduziert hat, zahlen Sie gegenüber des vorherigen Beispiels nur ein Drittel der Gebühren.

Wenn Sie die Datei zusätzlich zur Komprimierung (bei einem Verhältnis von 3:1) auch in ein Spaltenformat wie Apache Parquet konvertieren, werden nach wie vor 1 TB auf Amazon S3 hochgeladen. Im Spaltenformat von Parquet muss Amazon Athena nur die für die Abfrage relevanten Spalten lesen. Da die durchgeführte Abfrage nur eine Spalte referenziert, liest Athena nur diese Spalte, so dass zwei Drittel der Datei entfallen. Athena liest also nur ein Drittel der Datei und durchsucht so nur 0,33 TB der in S3 gespeicherten Daten.

  • Diese Abfrage kostet: 1,67 USD. Durch Komprimierung dritteln sich in diesem Beispiel die Kosten und durch das Spaltenformat dritteln sich die verbleibenden Kosten noch einmal.
    (Dateigröße = 3 TB/3 = 1 TB. Durchsuchte Daten, wenn nur eine Spalte eingelesen wird = 1 TB/3 = 0,33 TB. Preis für 0,33 TB = 0,33 * 5 USD/TB = 1,67 USD)