Amazon Redshift erweitert Data Warehouse-Abfragen auf Ihren Data Lake – kein Laden erforderlich. Sie können analytische Abfragen an Petabyte von Daten, die lokal in Redshift gespeichert sind, und direkt an Exabyte von Daten in Amazon S3 ausführen. Amazon Redshift ist einfach einzurichten, die meisten Verwaltungsaufgaben erfolgen automatisch, und es bietet höchste Performance in jeder Größenordnung.

Wichtigste Funktionen

Schnellere Leistung

Massiv parallel: Amazon Redshift liefert eine schnelle Abfrage-Performance an Datensets von Gigabyte- bis Exabyte-Volumen. Redshift verwendet eine spaltenbasierte Speicherung, Datenkomprimierung und Zonenzuordnungen, um den E/A-Aufwand bei der Ausführung von Abfragen zu verringern. Es nutzt eine Data Warehouse-Architektur mit massiv paralleler Verarbeitung (MPP; Massively Parallel Processing) zur Parallelisierung und Verteilung der SQL-Operationen auf alle verfügbaren Ressourcen. Die zugrunde liegende Hardware ist auf Hochleistungsdatenverarbeitung ausgerichtet, wobei lokal angeschlossene Speicher zur Maximierung des Durchsatzes zwischen den CPUs und den Laufwerken sowie ein Mesh-Netzwerk mit hoher Bandbreite zur Maximierung des Durchsatzes zwischen Knoten eingesetzt werden.

Maschinelles Lernen: Amazon Redshift nutzt Machine Learning zur Bereitstellung eines hohen Durchsatzes auf Basis des Workloads. Redshift verwendet hochentwickelte Algorithmen zur Prognose der Ausführungszeiten eingehender Abfragen und weist die Abfragen dann der Warteschlange zu, in der sie am schnellsten verarbeitet werden können. Beispielsweise werden Abfragen wie Dashboards und Berichte, die hohe Anforderungen an die Parallelverarbeitung stellen, zur sofortigen Verarbeitung an eine Express-Warteschlange weitergeleitet.

Ergebnis-Caching: Amazon Redshift legt Ergebnisse in einem Cache ab, um bei wiederholten Abfragen Reaktionszeiten von unter einer Sekunde zu erreichen. Dashboard-, Visualisierungs- und BI-Tools, bei denen die Wiederholung gleicher Abfragen gang und gäbe ist, erzielen so bedeutende Leistungssteigerungen. Bei jeder Abfrage durchsucht Redshift zunächst den Cache nach zwischengespeicherten Ergebnissen einer früheren Ausführung. Wenn ein gecachtes Ergebnis gefunden wird und sich die Daten nicht geändert haben, wird das gecachte Ergebnis sofort zurückgegeben, ohne die Abfrage erneut auszuführen.

Einfache Einrichtung, Bereitstellung und Verwaltung

Automatisierte Bereitstellung: Einrichtung und Betrieb von Amazon Redshift sind einfach. In der AWS-Konsole ist ein neues Data Warehouse mit wenigen Klicks erstellt, und Redshift stellt die erforderliche Infrastruktur automatisch für Sie bereit. Die meisten Verwaltungsaufgaben (z. B. Sicherung und Replikation) sind automatisiert, so dass Sie sich ganz auf Ihre Daten konzentrieren können. Falls Sie die von Redshift vorgenommenen Einstellungen ändern möchten, bietet Ihnen Redshift Optionen, mit denen Sie Ihre Änderungen speziell an Ihre spezifischen Workloads anpassen können. Neue Funktionen werden transparent eingeführt – eine zeitliche Planung und Anwendung von Upgrades und Patches entfällt dadurch.

Automatisierte Sicherungen: Amazon Redshift sichert neue Daten automatisch und kontinuierlich in Amazon S3. Für die Notfallwiederherstellung kann Redshift Ihre Snapshots asynchron in S3 in eine anderen Region replizieren. Sie können jeden System- oder Benutzer-Snapshot verwenden, um Ihren Cluster über die AWS-Managementkonsole oder die Redshift-APIs wiederherzustellen. Ihr Cluster ist wieder verfügbar, sobald die System-Metadaten wiederhergestellt sind, und Sie können bereits mit der Ausführung von Abfragen beginnen, während die Benutzerdaten noch im Hintergrund gespoolt werden.

Fehlertolerant: Amazon Redshift bietet verschiedene Funktionen, durch die Ihr Cluster aus Data Warehouses noch zuverlässiger wird. Durch kontinuierliche Überwachung des Clusterstatus, automatische Re-Replikation der Daten ausgefallener Laufwerke und bei Bedarf Ersatz von Knoten ist Redshift absolut fehlertolerant.

Integriert mit Tools von Drittanbietern: Optimieren Sie Ihre Arbeit mit Amazon Redshift durch branchenführende Tools und externe Experten, die Ihnen beim Laden, Transformieren und Visualisieren Ihrer Daten helfen. Die Lösungen unserer zahlreichen und in verschiedenen Bereichen qualifizierten Partner sind für Amazon Redshift zertifiziert.  

Kostengünstig

Keine Vorabkosten, nutzungsbasierte Zahlung: Amazon Redshift ist ein extrem kostengünstiges Data Warehouse, wobei Sie nur die Ressourcen zahlen, die Sie nutzen. Sie können schon ab 0,25 USD pro Stunde ohne Verpflichtung anfangen und für nur 250 USD pro Terabyte und Jahr skalieren. Redshift ist das einzige Data Warehouse in der Cloud, das On-Demand-Preise ohne Vorabkosten, Reserved Instances mit Kosteneinsparungen bis zu 75 % bei langfristiger Bindung für 1 oder 3 Jahre und Zahlung pro Abfrage nach der Menge der in Ihrem Amazon S3 Data Lake gescannten Daten anbietet.  Weitere Informationen erhalten Sie auf der Seite mit den Amazon Redshift-Preisen.

Auswahl des Knotentyps: Ihnen stehen zwei Knotentypen zur Auswahl, mit denen Sie Redshift für die Anforderungen Ihres Data Warehouse optimieren können. Dense Compute-Knoten (DC) ermöglichen das Einrichten besonders leistungsstarker Data Warehouses unter Verwendung von schnellen CPUs, großen Arbeitsspeichermengen und SSD-Festplatten (Solid-State Disks). Bei größeren Skalierungsanforderungen oder wenn Sie Kosten sparen möchten, können Sie auf die kostengünstigeren Dense Storage-Knoten (DS) umsteigen, die größere Festplattenlaufwerke zu einem extrem günstigen Preis bereitstellen. Das Vergrößern oder Verkleinern Ihres Clusters oder Wechseln zwischen Knotentypen erfordert nur einen einzelnen API-Aufruf oder einige Klicks in der AWS-Konsole.

Schnelle Skalierung ganz nach Ihren Anforderungen

Data Warehousing in Petabyte-Größe: Amazon Redshift ist einfach und lässt sich schnell schwankenden Anforderungen anpassen. Mit nur wenigen Klicks in der Konsole oder einem einfachen API-Aufruf können Sie die Anzahl oder den Typ der Knoten Ihres Data Warehouse ändern und in jede Richtung skalieren, sollten sich Ihre Anforderungen ändern.

Data Lake-Analysen in Exabyte-Umfang: Redshift Spectrum, eine Komponente von Redshift, ermöglicht die Ausführung von Abfragen an Exabyte von Daten in Amazon S3, ohne die Daten laden oder transformieren zu müssen. Amazon S3 können Sie als hoch verfügbaren, sicheren und kostengünstigen Data Lake zum Speichern unbegrenzter Datenmengen in offenen Datenformaten verwenden.

Grenzenlose Parallelverarbeitung: Mit Redshift Spectrum können mehrere Abfragen gleichzeitig auf die gleichen Daten in Amazon S3 zugreifen. Damit bietet Spectrum eine beispiellose Parallelität. Redshift Spectrum führt Abfragen parallel an Tausenden Knoten aus und liefert so extrem schnelle Ergebnisse, unabhängig von der Komplexität der Abfrage oder der Menge der gescannten Daten.

Abfragen Ihres Data Lake

Amazon S3 Data Lake: Amazon Redshift ist das einzige Data Warehouse, das Abfragen in Ihrem Amazon S3 Data Lake ohne Laden der Daten zulässt. Sie können die von Ihnen verwendeten offenen Dateiformate, beispielsweise Avro, CSV, Grok, JSON, ORC, Parquet und viele andere mehr, direkt in Amazon S3 abfragen. Dies gibt Ihnen die Flexibilität, hoch strukturierte, häufig verwendete Daten auf lokalen Redshift-Festplatten zu speichern und weitere Exabyte strukturierter und unstrukturierter Daten in S3. Beide Speicher können Sie nahtlos abfragen und erhalten so einzigartige Einblicke, die Sie durch Abfrage voneinander unabhängiger Datensets kaum erhalten würden.

AWS-Analyse-Ökosystem: Amazon Redshift ist nativ in das Analyse-Ökosystem von AWS integriert. AWS Glue kann Daten extrahieren, transformieren und in Redshift laden. Amazon Kinesis Data Firehose bietet die einfachste Methode, Streaming-Daten zu erfassen, zu transformieren und in Redshift zu laden, um dort Analysen in nahezu Echtzeit auszuführen. Mit Amazon QuickSight können Sie Berichte, Visualisierungen und Dashboards erstellen.  Um die Migration zu Amazon Redshift zu beschleunigen, können Sie den AWS Database Migration Service (DMS) sechs Monate lang kostenlos verwenden. Weitere Informationen »

Sicher

End-to-End-Verschlüsselung: Mit nur wenigen Parametereinstellungen können Sie Amazon Redshift für die Verwendung von SSL zum Absichern der Daten während der Übertragung und für die hardwarebeschleunigte AES-256-Verschlüsselung zum Absichern der Daten im Speicher konfigurieren. Wenn Sie die Verschlüsselung für Daten bei der Speicherung aktivieren, werden alle auf einen Datenträger geschriebenen sowie sämtliche Backups verschlüsselt. Standardmäßig übernimmt Amazon Redshift die Schlüsselverwaltung für Sie.

Netzwerkisolierung: In Amazon Redshift können Sie den Netzwerkzugriff auf Ihren Data Warehouse-Cluster mit Firewall-Regeln steuern. Sie können Amazon Redshift auch in Amazon VPC ausführen, um Ihren Data Warehouse-Cluster in Ihrem eigenen virtuellen Netzwerk zu isolieren und die Verbindung zur vorhandenen IT-Infrastruktur über dem Branchenstandard entsprechende, verschlüsselte IPsec-VPNs herzustellen.

Überprüfung und Compliance: Zur Überwachung sämtlicher Redshift-API-Aufrufe ist Amazon Redshift mit AWS CloudTrail integriert. Redshift protokolliert alle SQL-Vorgänge, so zum Beispiel Verbindungsversuche, Abfragen und Änderungen an Ihrer Datenbank. Sie können auf diese Protokolle über SQL-Abfragen an Systemtabellen zugreifen oder die Protokolle an einen sicheren Speicherort in Amazon S3 herunterladen. Amazon Redshift erfüllt die Vorgaben von SOC1, SOC2, SOC3 und PCI DSS Level 1. Weitere Informationen erhalten Sie unter AWS-Cloud – Compliance.

Weitere Informationen zu den Preisen von Amazon Glacier

Zur Seite mit den Preisen
Bereit zum Entwickeln?
Erste Schritte mit Amazon Redshift
Haben Sie Fragen?
Kontakt