Mit Amazon Redshift Spectrum können Sie Amazon Redshift-SQL-Abfragen für Datenvolumen im Exabyte-Bereich in Amazon S3 ausführen. Redshift Spectrum erweitert die Analyseleistung von Amazon Redshift über lokal in Ihrem Data Warehouse gespeicherte Daten hinaus und ermöglicht die Abfrage enormer Volumen unstrukturierter Daten in Ihrem Amazon S3-"Data Lake", ohne dass Daten geladen oder umgewandelt werden müssen. Redshift Spectrum nutzt eine fortschrittliche Abfrageoptimierung, mit der die Verarbeitung auf Tausende Knoten skaliert wird. Dadurch sind selbst bei großen Datensätzen und komplexen Abfragen schnelle Ergebnisse möglich.

Redshift Spectrum fragt Daten direkt in Amazon S3 ab. Dazu nutzt es die Open Source-Datenformate, die Sie bereits verwenden, einschließlich Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile und TSV. Da Redshift Spectrum dieselbe SQL-Syntax wie Amazon Redshift unterstützt, können Sie komplexe Abfragen mit den BI-Tools (Business Intelligence) ausführen, die Sie bereits verwenden. Außerdem sind Abfragen ausführbar, die sowohl die lokal in Amazon Redshift gespeicherten häufig genutzten Daten als auch Ihre kostengünstig in Amazon S3 gespeicherten vollständigen Datensätze betreffen.

Mit Redshift Spectrum haben Sie die Möglichkeit, Ihre Daten am von Ihnen bevorzugten Ort und im bevorzugten Format zu speichern, sodass sie Ihnen bei Bedarf für die Verarbeitung zur Verfügung stehen. Für Redshift Spectrum fallen keine Vorauszahlungen oder Verpflichtungen an; Sie zahlen nur für die ausgeführten Abfragen.

Dory_Feature_Start_Querying_Instantly

Mit Amazon Redshift Spectrum können Sie Ihre Daten in Amazon S3 sofort abfragen, ohne sie zuvor laden oder umwandeln zu müssen. Sie müssen lediglich Ihren Amazon Athena, AWS Glue-Datenkatalog oder Apache Hive-Metaspeicher als externes Schema registrieren. Sie können dieselbe SQL wie für die Abfrage von Amazon Redshift-Tabellen sowie alle BI-Tools verwenden, die Redshift bereits unterstützen.

Dory_Feature_Fast_Performance

Amazon Redshift bietet eine extrem hohe Leistung – ob bei Ad-hoc-Analysen großer, unstrukturierter Datensätze in Amazon S3 oder häufiger Analysen strukturierter Datensätze in Redshift-Tabellen. Sie können aktive Daten in Ihren Amazon Redshift-Clustern verwalten, um eine Leistung wie bei lokalen Datenträgern zu erhalten. Mit Amazon Redshift Spectrum können Sie Ihre Abfragen auf in Amazon S3 gespeicherte inaktive Daten erweitern, um eine unbegrenzte Skalierbarkeit bei niedrigen Kosten zu ermöglichen. Die Amazon Redshift-Abfrageoptimierung ermittelt automatisch, wie in Amazon S3 gescannte Daten minimiert werden können, und bestimmt die Anzahl der in der Abfrage zu verwendenden Redshift Spectrum-Knoten.

Dory_Feature_Scalable

Mit Amazon Redshift Spectrum müssen Sie sich keine Gedanken über die Skalierung Ihres Clusters machen. Durch die Trennung von Speicher- und Rechenressourcen können Sie beides unabhängig voneinander skalieren. Für unbegrenzte gleichzeitige Zugriffe können Sie sogar mehrere Amazon Redshift-Cluster für einen einzigen Amazon S3-Data Lake betreiben. Redshift Spectrum kann bei Bedarf automatisch auf Tausende Instances skaliert werden. So werden Abfragen jederzeit schnell ausgeführt – unabhängig davon, ob ein Terabyte, ein Petabyte oder ein Exabyte verarbeitet wird.

Dory_Feature_Pay_per_query

Bei Amazon Redshift Spectrum zahlen Sie nur für die Abfragen, die Sie ausführen. Für die Ausführung Ihrer Abfrage werden Ihnen 5 USD pro Terabyte verarbeiteter Daten berechnet. Redshift Spectrum kann auch komprimierte Daten abfragen. Sie können sowohl 30 bis 90 % Ihrer abfragebasierten Kosten sparen als auch die Leistung erhöhen, indem Sie Ihre Daten komprimieren, partitionieren und in ein Spaltenformat konvertieren. Wenn Sie keine Abfragen ausführen, fallen keine Kosten für Redshift Spectrum an. Für Datenspeicher zahlen Sie die Amazon S3-Standardpreise und für die verwendeten Cluster die Amazon Redshift-Instance-Preise.