Veröffentlicht am: Sep 5, 2018
Amazon S3 kündigt Funktionserweiterungen für S3 Select an. S3 Select ist eine Amazon S3-Funktion, mit der nur die für ein Objekt benötigten Daten abgerufen werden. Hierdurch wird die Leistung erheblich gesteigert und die Kosten für Anwendungen gesenkt, die Daten aus S3 abrufen müssen.
Aktuell funktioniert Amazon S3 Select mit Objekten, die im CSV- und JSON-Format gespeichert sind. Basierend auf Kundenfeedback freuen wir uns, die Unterstützung von S3 Select für das Apache Parquet-Format, für JSON Arrays und für die BZIP2-Komprimierung für CSV- und JSON-Objekte bekannt zu geben. Wir fügen auch Unterstützung für CloudWatch-Metriken für S3 Select hinzu, mit denen Sie die Verwendung von S3 Select für Ihre Anwendungen überwachen können.
Parquet wird weithin angenommen, weil es eine Vielzahl von Abfrage-Engines wie Hive, Presto und Impala sowie mehrere Frameworks wie Spark und MapReduce unterstützt. S3 Select Parquet ermöglicht Ihnen die Verwendung von S3 Select zum Abrufen bestimmter Spalten aus den in S3 gespeicherten Daten und unterstützt die spaltenweise Komprimierung mit GZIP oder Snappy. Sie können das Format in den Ergebnissen entweder als CSV oder JSON angeben und festlegen, wie die Datensätze im Ergebnis abgegrenzt werden.
Mit der Unterstützung von JSON Arrays können Sie über innere Knoten in den JSON-Objekten iterieren. Sie können diese verschachtelten JSON-Objekte abfragen, indem Sie die Pfadnavigation in der FROM-Klausel der S3 Select-Abfragen angeben.
BZIP2 ist ein weit verbreitetes Kompressionsformat, das zur Komprimierung von textuellen Daten verwendet wird und typischerweise effizienter ist als viele andere Arten von Komprimierungsalgorithmen.
Mit den CloudWatch-Metriken für S3 können Sie den Zustand Ihrer Anwendungen im Blick behalten. Diese Kennzahlen sind im 1-Minuten-Takt verfügbar und ermöglichen es Ihnen, operative Probleme schnell zu identifizieren und zu beheben. Zu den neuen spezifischen Metriken von S3 Select gehören die Anzahl der S3 Select-Anfragen, die Menge der gescannten Daten und die Menge der zurückgegebenen Daten.
Diese Funktionen für Amazon S3 Select sind ab sofort in allen kommerziellen AWS-Regionen verfügbar.
Um mehr über Amazon S3 Select zu erfahren, besuchen Sie bitte die Seite Inhalte aus Objekten auswählen im Amazon S3-Entwicklerhandbuch. Um mehr über Amazon CloudWatch-Metriken für S3 zu erfahren, besuchen Sie bitte die Seite Metriken mit Amazon CloudWatch überwachen im Amazon S3-Entwicklerhandbuch. Lesen Sie für die ersten Schritte unter AWS-Managementkonsole nach.