F: Was ist Amazon Athena?

Amazon Athena ist ein interaktiver Abfrageservice, der die Analyse von Daten in Amazon S3 mit Standard-SQL erleichtert. Athena ist serverlos, sodass keine Infrastruktur eingerichtet oder verwaltet werden muss und Sie sofort mit dem Analysieren von Daten beginnen können. Sie müssen nicht einmal Daten in Athena laden. Athena arbeitet direkt mit den in S3 gespeicherten Daten. Um zu beginnen, melden Sie sich einfach bei der Athena-Verwaltungskonsole an, definieren Ihr Schema und beginnen mit dem Abfragen. Amazon Athena verwendet Presto mit vollständigem Support für Standard-SQL und arbeitet mit einer Vielzahl von Standard-Datenformaten wie beispielsweise CSV, JSON, ORC, Apache Parquet und Avro zusammen. Während Amazon Athena ideal für schnelle Adhoc-Abfragen geeignet ist und in Amazon QuickSight integriert werden kann, um einfache Visualisierungen durchzuführen, kann es auch komplexe Analysen einschließlich großer Joins, Fensterfunktionen und Arrays erstellen.

F: Was kann ich mit Amazon Athena tun?

Amazon Athena unterstützt Sie beim Analysieren von Daten, die in Amazon S3 gespeichert sind. Sie können Athena verwenden, um Adhoc-Anfragen mit ANSI SQL auszuführen, ohne dass Sie die Daten in Athena aggregieren oder laden müssen. Amazon Athena kann unstrukturierte, semi-strukturierte und strukturierte Datensätze verarbeiten. Dazu gehören CSV-, JSON- und Avro-Daten sowie Daten im Spaltenformat wie beispielsweise Apache Parquet und Apache ORC. Amazon Athena kann in Amazon QuickSight integriert werden, um eine einfache Visualisierung zu erreichen. Darüber hinaus können Sie Amazon Athena verwenden, um Berichte zu erstellen oder Daten mit Business Intelligence-Tools oder SQL-Clients, die über einen JDBC-Treiber verbunden sind, zu untersuchen.

F: Welches sind die ersten Schritte bei einem Einstieg in Amazon Athena?

Um mit Amazon Athena zu beginnen, melden Sie sich einfach bei der AWS Management Console für Athena an und erstellen Ihr Schema, indem Sie DDL-Anweisungen auf der Konsole schreiben oder indem Sie einen Assistenten zur Tabellenerstellung verwenden. Sie können dann mit der Abfrage von Daten beginnen, indem Sie einen integrierten Abfrage-Editor verwenden. Athena fragt Daten direkt von Amazon S3 ab, sodass kein Laden erforderlich ist.  

F: Wie kann ich auf Amazon Athena zugreifen?

Auf Amazon Athena können Sie über die AWS Management Console, eine API und über einen JDBC-Treiber zugreifen. Sie können programmgesteuerte Abfragen durchführen sowie Tabellen oder Partitionen mithilfe des JDBC-Treibers hinzufügen.  

F: Welche Service-Limits gibt es in Verbindung mit Amazon Athena?

Bitte klicken Sie hier, um mehr über die Service-Limits zu erfahren.

F: Welche Technologie bildet die Basis für Amazon Athena?

Amazon Athena verwendet Presto mit vollständigem Support für Standard-SQL und arbeitet mit einer Vielzahl von Standard-Datenformaten wie beispielsweise CSV, JSON, ORC, Avro und Parquet zusammen. Amazon Athena kann komplexe Analysen einschließlich großer Joins, Fensterfunktionen und Arrays erstellen. Da Amazon Athena Amazon S3 als zugrunde liegenden Datenspeicher verwendet, ist es hochgradig verfügbar und dauerhaft, wobei die Daten redundant in mehreren Speicherzentren und in jedem Speicherzentrum auf mehreren Geräten gespeichert werden.

F: Wie speichert Amazon Athena Tabellendefinitionen und Schemata?

Amazon Athena speichert Informationen und Schemata zu den Datenbanken und Tabellen, die Sie für Ihre in Amazon S3 gespeicherten Daten erstellen, in einem verwalteten Datenkatalog. In Regionen, in denen AWS Glue verfügbar ist, können Sie ein Upgrade ausführen, um den AWS Glue-Datenkatalog mit Amazon Athena zu verwenden. In Regionen, in denen AWS Glue nicht verfügbar ist, verwendet Athena einen internen Katalog.

Sie können den Katalog mithilfe von DDL-Anweisungen oder über die AWS Management Console bearbeiten. Alle von Ihnen definierten Schemata werden automatisch gespeichert, es sei denn, Sie löschen sie ausdrücklich. Athena verwendet die Schema-on-Read-Technologie. Dies bedeutet, dass Ihre Tabellendefinitionen auf ihre Daten in S3 angewendet werden, wenn Abfragen ausgeführt werden. Es müssen keine Daten geladen werden und es sind keine Transformationen erforderlich. Sie können Tabellendefinitionen und Schemata löschen, ohne dass dies Auswirkungen auf die zugrunde liegenden Daten hat, die in Amazon S3 gespeichert sind.

F: Warum sollte ich ein Upgrade auf den AWS Glue-Datenkatalog durchführen?

AWS Glue ist ein vollständig verwalteter ETL-Service. Glue umfasst drei Hauptkomponenten: 1) einen Crawler, der automatisch Ihre Datenquellen scannt, Datenformate identifiziert und Schemata ableitet, 2) einen vollständig verwalteten ETL-Service, mit dem Sie Daten transformieren und an verschiedene Ziele verschieben können, sowie 3) einen Datenkatalog zum Speichern von Metadaten zu Datenbanken und Tabellen, die in S3 oder einem JDBC-kompatiblen Datenspeicher gespeichert werden. Um die Vorteile von Glue nutzen zu können, ist ein Upgrade vom internen Athena-Datenkatalog auf den Glue-Datenkatalog erforderlich.

Das Upgrade auf den Glue-Datenkatalog bietet folgende Vorteile:

  1. Einheitliches Metadaten-Repository: AWS Glue lässt sich in zahlreiche AWS-Services integrieren. AWS Glue unterstützt gespeicherte Daten in Amazon Aurora, Amazon RDS MySQL, Amazon RDS PostreSQL, Amazon Redshift und Amazon S3 sowie MySQL- und PostgreSQL-Datenbanken in Ihrer Virtual Private Cloud (Amazon VPC), die auf Amazon EC2 ausgeführt wird. AWS Glue ermöglicht die vorkonfigurierte Integration in Amazon Athena, Amazon EMR, Amazon Redshift Spectrum sowie jegliche mit Apache Hive Metastore kompatiblen Anwendungen.
  2. Automatische Schema- und Partitionserkennung: AWS Glue scannt automatisch Ihre Datenquellen, identifiziert Datenformate und schlägt Schemata und Transformationen vor. Crawler können die Automatisierung der Tabellenerstellung sowie das automatische Laden von Partitionen erleichtern.
  3. Einfach zu erstellende Pipelines: Das ETL-Modul von AWS Glue generiert benutzerdefinierbaren Python-Code, der wiederverwendet und portiert werden kann. Erstellen Sie den Code mit Ihrer bevorzugten IDE oder einem Notizbuch, und nutzen Sie ihn über GitHub gemeinsam mit anderen Anwendern. Sobald Ihr ETL-Auftrag bereit ist, können Sie dessen Ausführung innerhalb der vollständig verwalteten, skalierten Spark-Infrastruktur von AWS Glue planen. AWS Glue ist serverlos und verwaltet die Bereitstellung, Konfiguration und Skalierung der zum Ausführen Ihrer ETL-Jobs erforderlichen Ressourcen. ETL ist dadurch eng in Ihren Workflow integrierbar.

Klicken Sie hier, um mehr über den AWS Glue-Datenkatalog zu erfahren.

F: Gibt es eine Schritt-für-Schritt-Anleitung für das Upgrade auf den AWS Glue-Datenkatalog?

Ja. Eine Schritt-für-Schritt-Anleitung finden Sie hier.

F: In welchen AWS-Regionen ist Amazon Athena verfügbar?

Weitere Informationen zur Verfügbarkeit von Amazon Athena-Services nach Regionen finden Sie unter Regionale Produkte und Services.

F: Was ist der Unterschied zwischen Amazon Athena, Amazon EMR und Amazon Redshift?

Abfrageservices wie Amazon Athena, Data Warehouses wie Amazon Redshift und hoch entwickelte Datenverarbeitungs-Frameworks wie Amazon EMR sind für unterschiedliche Anforderungen und Anwendungsfälle konzipiert. Sie müssen lediglich das richtige Tool für den Job auswählen. Amazon Redshift bietet die schnellste Abfrageleistung für Unternehmensberichte und Business Intelligence-Arbeitslasten, besonders wenn es sich um extrem komplexe SQL-Abfragen mit mehreren Joins und Unterabfragen handelt. Mit Amazon EMR ist es im Vergleich zu Vor-Ort-Bereitstellungen einfach und kostengünstig, hochgradig verteilte Verarbeitungs-Frameworks wie beispielsweise Hadoop, Spark und Presto auszuführen. Amazon EMR ist flexibel: Sie können benutzerdefinierte Anwendungen und Code ausführen sowie spezielle Parameter für Computing, Speicher und Anwendungen definieren, um Ihre Analyseanforderungen zu optimieren. Amazon Athena bietet die einfachste Möglichkeit zum Ausführen von Adhoc-Abfragen auf Daten in S3, ohne dass Server eingerichtet oder verwaltet werden müssen.

F: Wann sollten Sie ein voll funktionsfähiges Data Warehouse für Unternehmen wie beispielsweise Amazon Redshift statt eines Abfrageservice wie beispielsweise Amazon Athena verwenden?

Ein Data Warehouse wie beispielsweise Amazon Redshift ist Ihre beste Wahl, wenn Sie Daten aus vielen unterschiedlichen Quellen wie Lagerbestandssystemen, Finanzsystemen und Einzelhandelssystemen in einem einheitlichen Format zusammenführen und langfristig speichern müssen, um ausgefeilte Unternehmensberichte aus älteren Daten zu erstellen. In solchen Fällen ist Amazon Redshift Ihre beste Wahl.

Data Warehouses sammeln Daten aus allen Bereichen eines Unternehmens und bilden eine "zentrale Quelle der Wahrheit" für Berichterstellung und Analyse. Data Warehouses führen Daten aus vielen Quellen zusammen. Sie formatieren, organisieren und speichern die Daten und unterstützen komplexe Hochgeschwindigkeitsabfragen, aus denen Unternehmensberichte erstellt werden. Das Abfragemodul in Amazon Redshift wurde so optimiert, dass es eine besonders gute Leistung bringt, wenn Sie komplexe Abfragen mit Verknüpfungen großer Zahlen aus sehr großen Datenbanktabellen ausführen. TPC-DS ist ein Standard-Vergleichstest zum Replizieren dieses Anwendungsfalls und Redshift führt diese Abfragen bis zu 20-mal schneller aus als Abfrageservices, die für unstrukturierte Daten optimiert sind. Wenn Sie Abfragen auf hochgradig strukturierte Daten mit vielen Joins von sehr großen Tabellen ausführen müssen, sollten Sie sich für Amazon Redshift entscheiden.

Im Vergleich dazu machen es Services wie beispielsweise Amazon Athena einfach, interaktive Abfragen auf Daten direkt in Amazon S3 auszuführen, ohne sich mit dem Formatieren von Daten oder dem Verwalten von Infrastruktur befassen zu müssen. Athena ist zum Beispiel großartig, wenn Sie nur eine schnelle Abfrage einiger Weblogs ausführen müssen, um ein Leistungsproblem Ihrer Website zu beheben. Mit Abfrage-Services können Sie schnell beginnen. Sie definieren einfach eine Tabelle für Ihre Daten und beginnen Ihre Abfragen mit Standard-SQL.

Sie können auch beide Services zusammen verwenden. Wenn Sie Ihre Daten vor dem Laden in Amazon Redshift in Amazon S3 bereitstellen, können diese Daten auch für Amazon Athena registriert und davon abgefragt werden.

F: Wann sollte ich Amazon EMR anstatt Amazon Athena verwenden?

Amazon EMR bietet viel mehr als nur SQL-Abfragen. Mit EMR können Sie eine Vielzahl von Datenverarbeitungsaufgaben mit horizontaler Skalierung für Anwendungen ausführen wie beispielsweise maschinelles Lernen, Grafikanalysen, Datentransformationen, Daten-Streaming und praktisch alles, was sie codieren können. Sie sollten Amazon EMR verwenden, wenn Sie benutzerdefinierten Code zum Verarbeiten und Analysieren extrem großer Datensätze mit den neuesten Frameworks für Big Data-Bearbeitungen wie beispielsweise Spark, Hadoop, Presto oder Hbase einsetzen. Amazon EMR gibt Ihnen die volle Kontrolle über die Konfiguration Ihrer Cluster und der darauf installierten Software.

Sie sollten Amazon Athena verwenden, wenn Sie interaktive Adhoc-SQL-Abfragen in Amazon S3 ausführen. Dabei ist es nicht erforderlich, Infrastruktur oder Cluster zu verwalten.

F: Kann ich Amazon Athena zum Abfragen von Daten verwenden, die ich mit Amazon EMR verarbeitete?

Ja, Amazon Athena unterstützt viele der gleichen Datenformate wie Amazon EMR. Der Datenkatalog von Athena ist kompatibel mit Hive Metastore. Wenn Sie EMR verwenden und bereits einen Hive Metastore haben, führen Sie Ihre DDL-Anweisungen einfach in Amazon Athena aus. Sie können dann sofort mit der Abfrage Ihrer Daten beginnen, ohne dass dies Auswirkungen auf Ihre Amazon EMR-Jobs hat.

F: Wie kann ich Tabellen und Schemata für meine Daten in Amazon S3 erstellen?

Amazon Athena verwendet Apache Hive DDL zum Definieren von Tabellen. Sie können DDL-Anweisungen über die Athena-Konsole, einen JDBC-Treiber oder die API ausführen oder den Assistenten zur Tabellenerstellung von Athena verwenden. Wenn sie den AWS Glue-Datenkatalog mit Athena verwenden, können Sie Schemas und Partitionen auch automatisch mit Glue-Crawlern ableiten. AWS Glue-Crawler werden mit einem Datenspeicher verbunden und durchsuchen eine priorisierte Liste mit Klassifizierungen, um das Schema für Ihre Daten sowie weitere Statistiken zu extrahieren. Diese Metadaten werden anschließend in den Glue-Datenkatalog übertragen. Crawler können regelmäßig ausgeführt werden, um neu verfügbare Daten sowie Änderungen an bestehenden Daten einschließlich Änderungen an Tabellendefinitionen zu ermitteln. Mit Crawlern werden automatisch neue Tabellen sowie Partitionen zu bestehenden Tabellen und neue Versionen von Tabellendefinitionen hinzugefügt. Sie können AWS Glue-Crawler auch anpassen, um Ihre eigenen Dateintypen zu klassifizieren.

Wenn Sie in Amazon Athena ein neues Tabellenschema erstellen, wird dieses im Datenkatalog gespeichert und zum Ausführen von Abfragen verwendet. Ihre Daten in S3 bleiben dabei unverändert. Athena verwendet eine Methode, die als Schema-on-Read bezeichnet wird und die es Ihnen ermöglicht, Ihr Schema zur Ausführungszeit einer Abfrage auf Ihre Daten anzuwenden. Dadurch müssen die Daten nicht mehr geladen oder transformiert werden. Weitere Informationen zum Erstellen von Tabellen.

F: Welche Datenformate unterstützt Amazon Athena?

Amazon Athena unterstützt eine Vielzahl von Datenformaten wie beispielsweise CSV, TSV, JSON oder Textdateien. Außerdem werden Open Source-Spaltenformate wie Apache ORC und Apache Parquet unterstützt. Darüber hinaus unterstützt Athena komprimierte Daten in den Formaten Snappy, Zlib, LZO und GZIP. Durch Komprimieren, Partitionieren und das Verwenden von Spaltenformaten können Sie die Leistung verbessern und Ihre Kosten reduzieren.

F: Welche Arten von Datentypen unterstützt Amazon Athena?

Amazon Athena unterstützt sowohl einfache Datentypen wie INTEGER, DOUBLE und VARCHAR als auch komplexe Datentypen wie MAPS, ARRAY und STRUCT.  

F: Kann ich in Athena beliebige Hive-Abfragen verwenden?

Amazon Athena verwendet Hive nur für DDL (Data Definition Language) und zum Erstellen, Modifizieren und Löschen von Tabellen und/oder Partitionen. Eine vollständige Liste der unterstützten Anweisungen finden Sie hier. Athena verwendet Presto, wenn Sie Ihre SQL-Abfrage in Amazon S3 ausführen. Sie können ANSI-kompatible SQL SELECT-Anweisungen ausführen, um Ihre Daten in Amazon S3 abzufragen.

F: Was ist ein SerDe?

SerDe steht für Serializer/Deserializer, bei denen es sich um Bibliotheken handelt, die Hive Anweisungen zum Interpretieren von Datenformaten geben. Hive DLL-Anweisungen setzen voraus, dass Sie einen SerDe angeben, damit das System weiß, wie die Daten zu interpretieren sind, auf die Sie verweisen. Amazon Athena verwendet SerDes, um die aus Amazon S3 gelesenen Daten zu interpretieren. Das Konzept von SerDes in Athena ist das gleiche wie das Konzept, das in Hive verwendet wird. Amazon Athena unterstützt die folgenden SerDes:

  1. Apache Weblogs: "org.apache.hadoop.hive.serde2.RegexSerDe"
  2. CSV: "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe"
  3. TSV: "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe"
  4. Benutzerdefinierte Trennzeichen: "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe"
  5. Parquet: "org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe"
  6. Orc: "org.apache.hadoop.hive.ql.io.orc.OrcSerde"
  7. JSON: "org.apache.hive.hcatalog.data.JsonSerDe" ODER org.openx.data.jsonserde.JsonSerDe

F: Kann ich meinen eigenen SerDe (Serializer/Deserializer) zu Amazon Athena hinzufügen?

Zur Zeit können Sie Ihren eigenen SerDe nicht zu Amazon Athena hinzufügen. Wir begrüßen ihr Feedback und wenn es SerDes gibt, die Sie hinzugefügt haben möchten, wenden Sie sich bitte unter Athena-feedback@amazon.com an das Athena-Team.

F: Ich habe Parquet-/ORC-Dateien mithilfe von Spark/Hive erstellt. Kann ich sie über Athena abfragen?

Ja, Parquet- und ORC-Dateien, die mithilfe von Spark erstellt wurden, können in Athena gelesen werden.

F: Ich erhalte Daten von Kinesis Firehose. Wie kann ich sie mithilfe von Athena abfragen?

Wenn Ihre Kinesis Firehose-Daten in Amazon S3 gespeichert sind, können Sie sie mithilfe von Amazon Athena abfragen. Erstellen Sie in Athena einfach ein Schema für Ihre Daten und beginnen Sie mit der Abfrage. Wir empfehlen Ihnen, dass Sie die Daten in Partitionen organisieren, um die Leistung zu optimieren. Sie können Partitionen, die von Kinesis Firehose erstellt wurden, mithilfe von ALTER TABLE DDL-Anweisungen hinzufügen. Weitere Informationen über Partitionen.

F: Unterstützt Amazon Athena die Datenpartitionierung?

Ja. Amazon Athena ermöglicht Ihnen, Ihre Daten nach beliebigen Spalten zu partitionieren. Mit Partitionen kann die Menge der bei einer Abfrage berücksichtigten Daten eingeschränkt werden, was zu Kosteneinsparungen und schnellerer Ausführung führt. Sie können Ihr Partitionierungsschema mit der Klausel PARTITIONED BY in der Anweisung CREATE TABLE festlegen. Weitere Informationen über die Partitionierung von Daten.

F: Wie kann ich einer vorhandenen Tabelle in Amazon Athena neue Daten hinzufügen?

Wenn Ihre Daten partitioniert sind, müssen Sie eine Metadatenabfrage (ALTER TABLE ADD PARTITION) ausführen, um die Partition zu Athena hinzuzufügen, wenn in Amazon S3 neue Daten verfügbar werden. Wenn Ihre Daten nicht partitioniert sind, werden neue Daten automatisch zu Athena hinzugefügt, wenn die Daten oder Dateien dem vorhandenen Präfix hinzugefügt werden. Weitere Informationen über die Partitionierung von Daten.

F: Ich habe bereits große Mengen von Protokolldaten in Amazon S3. Kann ich Amazon Athena verwenden, um diese Daten abzufragen?

Ja, mit Amazon Athena ist es sehr einfach, SQL-Standardabfragen auf Ihren vorhandenen Protokolldaten auszuführen. Athena fragt Daten direkt von Amazon S3 ab, sodass kein Verschieben oder Laden erforderlich ist. Sie definieren Ihr Schema einfach mit DDL-Anweisungen und beginnen sofort mit der Abfrage Ihrer Daten.

F: Welche Arten von Abfragen unterstützt Amazon Athena?

Amazon Athena unterstützt ANSI SQL-Abfragen. Amazon Athena verwendet Presto, ein speicherresidentes, verteiltes Open Source-SQL-Modul, und kann komplexe Analysen einschließlich großer Joins, Fensterfunktionen und Arrays erstellen.

F: Kann ich Amazon QuickSight mit Amazon Athena verwenden?

Ja. Amazon Athena wird mit Amazon QuickSight integriert, was Ihnen eine einfache Visualisierung Ihrer in Amazon S3 gespeicherten Daten ermöglicht.

F: Unterstützt Athena andere BI-Tools und SQL-Clients?

Ja. Amazon Athena wird mit einem JDBC-Treiber geliefert, mit dem sie andere Business Intelligence-Tools und SQL-Clients verwenden können. Weitere Informationen über denJDBC-Treiber in Athena.

F: Unterstützt Athena benutzerdefinierte Funktionen (UDFs)?

Zur Zeit unterstützt Athena keine benutzerdefinierten Funktionen. Falls Sie Unterstützung für UDFs benötigen, senden Sie uns bitte eine E-Mail anathena-feedback@amazon.com, sodass wir mehr über Ihre Anforderungen erfahren.

F: Wie kann ich auf die Funktionen zugreifen, die von Amazon Athena unterstützt werden?

Klicken Sie hier, um weitere Informationen über die von Amazon Athena unterstützten Funktionen zu erhalten.

F: Wie kann ich die Leistung meiner Abfrage verbessern?

Sie können die Leistung Ihrer Abfrage verbessern, indem Sie Ihre Daten komprimieren, partitionieren oder in Spaltenformate umwandeln. Amazon Athena unterstützt Open Source-Spaltenformate für Daten wie beispielsweise Apache Parquet und Apache ORC. Das Umwandeln Ihrer Daten in ein komprimiertes Format oder ein Spaltenformat senkt Ihre Kosten und verbessert die Abfrageleistung, da Athena in die Lage versetzt wird, beim Ausführen Ihrer Abfrage weniger Daten von S3 abzurufen.

F: Wie steuere ich den Zugriff auf meine Daten?

Amazon Athena ermöglicht es Ihnen, den Zugriff auf Ihre Daten zu steuern, indem Sie IAM-Richtlinien (AWS Identity and Access Management), Zugriffssteuerungslisten und Amazon S3-Bucket-Richtlinien verwenden. Dank der IAM-Richtlinien können Sie IAM-Benutzern detaillierte Rechte zur Kontrolle Ihres S3-Buckets gewähren. Durch die Kontrolle des Zugriffs auf Daten in S3 können Sie die Abfrage der Daten durch Benutzer mithilfe von Athena einschränken.

Kann Athena verschlüsselte Daten in Amazon S3 abfragen?

Ja. Sie können Daten abfragen, die über eine serverseitige Verschlüsselung mit Amazon S3-Managed Encryption Keys, eine serverseitige Verschlüsselung mit durch AWS Key Management Service (KMS) verwalteten Schlüsseln und über eine clientseitige Verschlüsselung mit durch KMS verwalteten Schlüsseln verschlüsselt wurden. Darüber hinaus kann Amazon Athena in KMS integriert werden und bietet Ihnen eine Option für die Verschlüsselung Ihrer Ergebnismengen.

F: Ist Athena hoch verfügbar?

Ja. Amazon Athena ist hoch verfügbar und führt Abfragen mithilfe von Computerressourcen an mehreren Standorten durch, wobei Abfragen automatisch entsprechend umgeleitet werden, wenn ein bestimmter Standort nicht erreichbar ist. Athena verwendet Amazon S3 als zu Grunde liegenden Datenspeicher und macht ihre Daten hoch verfügbar und dauerhaft. Amazon S3 bietet eine beständige Infrastruktur zum Speichern wichtiger Daten und ist für eine Beständigkeit von 99,999999999 % der Objekte konzipiert. Ihre Daten werden redundant an mehreren Standorten und auf mehreren Geräten an jedem Standort gespeichert.

F: Kann ich kontenübergreifenden Zugriff auf den S3-Bucket einer anderen Person anbieten?

Ja, Sie können kontenübergreifenden Zugriff auf Amazon S3 anbieten.

F: Wie sind die Preise für Amazon Athena gestaltet?

Die Preise für Amazon Athena werden pro Abfrage berechnet und beruhen auf der Menge der Daten, die von der Abfrage abgerufen wird. In Amazon S3 können Sie Daten in einer Vielzahl von Formaten speichern. Wenn Sie Ihre Daten komprimieren, partitionieren oder in ein Spaltenformat umwandeln, entstehen weniger Kosten, da Sie weniger Daten abrufen. Die Umwandlung von Daten in ein Spaltenformat ermöglicht es Athena, nur die Spalten zu lesen, die zum Verarbeiten der Abfrage erforderlich sind. Weitere Informationen finden Sie auf der Seite mit den Preisangaben für Athena.

F: Warum entstehen mir weniger Kosten, wenn ich ein Spaltenformat verwende?

Amazon Athena stellt Ihnen die Menge der Daten in Rechnung, die pro Abfrage abgerufen werden. Wenn Sie Ihre Daten komprimieren, liest Amazon Athena weniger Daten ein. Wenn Sie Ihre Daten in ein Spaltenformat umwandeln, kann Athena sich auf die Spalten beschränken, die zum Verarbeiten der Daten erforderlich sind. Wenn Sie Ihre Daten in Partitionen aufteilen, kann Athena ebenfalls die Menge der abgerufenen Daten einschränken. Dies führt zu Kosteneinsparungen und besserer Leistung. Details finden Sie in den Preisbeispielen.

F: Wie kann ich meine Kosten senken?

Sie können 30 % bis 90 % Ihrer Abfragekosten einsparen und eine bessere Leistung erhalten, indem Sie Ihre Daten komprimieren, partitionieren oder in ein Spaltenformat umwandeln. Jede dieser Maßnahmen reduziert die Menge der Daten, die Amazon Athena abrufen muss, um eine Abfrage auszuführen. Amazon Athena unterstützt Apache Parquet und ORC, zwei der beliebtesten Open Source-Spaltenformate. Auf der Athena-Konsole können Sie die Menge der Daten sehen, die für die einzelnen Abfragen abgerufen wurden.  

F: Stellt Amazon Athena mir Kosten für fehlgeschlagene Abfragen in Rechnung?

Nein, fehlgeschlagene Abfragen werden Ihnen nicht in Rechnung gestellt.

F: Stellt Amazon Athena mir abgebrochene Abfragen in Rechnung?

Ja, wenn Sie eine Abfrage manuell abbrechen, wird Ihnen die Menge der Daten in Rechnung gestellt, die bis zum Abbruch der Abfrage abgerufen wurden.

F: Entstehen zusätzliche Kosten in Verbindung mit Amazon Athena?

Amazon Athena fragt Daten direkt aus Amazon S3 ab. Daher werden Ihre Quelldaten zu S3-Gebühren in Rechnung gestellt. Wenn Amazon Athena eine Abfrage ausführt, werden die Ergebnisse in einem S3-Bucket Ihrer Wahl gespeichert und für diese Ergebnissätze werden Ihnen die S3-Standardpreise in Rechnung gestellt. Wir empfehlen, dass Sie diese Buckets überwachen und Lebenszyklusrichtlinien verwenden, um zu steuern, wie viele Daten aufbewahrt werden.

F: Ist die Nutzung des AWS Glue-Datenkatalogs kostenpflichtig?

Ja, die Nutzung des AWS Glue-Datenkatalogs wird separat berechnet. Klicken Sie hier, um mehr über die Preise für den Glue-Datenkatalog zu erfahren.