Amazon Redshift

Übersicht
Features
Preise
Lösungen
Ressourcen

Amazon-Redshift-Integration für Apache Spark

Apache-Spark-Anwendungen erstellen, die Daten von Amazon Redshift lesen und schreiben

Probieren Sie den Konnektor mit Amazon EMR 6.9 aus

Warum Amazon-Redshift-Integration für Apache Spark?

Die Amazon-Redshift-Integration für Apache Spark vereinfacht und beschleunigt Apache-Spark-Anwendungen, welche auf Amazon Redshift-Daten von AWS-Analyseservices wie Amazon EMR, AWS Glue und Amazon SageMaker zugreifen. Mit Amazon EMR, AWS Glue und SageMaker können Sie schnell Apache-Spark-Anwendungen erstellen, die aus Ihrem Data Warehouse in Amazon Redshift lesen und in dieses schreiben, ohne die Leistung oder Transaktionskonsistenz zu beeinträchtigen. Die Amazon-Redshift-Integration für Apache Spark verwendet auch AWS Identity and Access Management(IAM)-basierte Anmeldeinformationen, um die Sicherheit zu verbessern. Mit der Amazon-Redshift-Integration für Apache Spark entfällt die manuelle Einrichtung und Wartung von nicht zertifizierten Versionen von Konnektoren von Drittanbietern. Sie können innerhalb von Sekunden mit Apache-Spark-Aufträgen beginnen, indem Sie Daten in Amazon Redshift verwenden. Diese neue Integration verbessert die Leistung von Apache-Spark-Anwendungen mit Amazon-Redshift-Daten.

Vorteile von Amazon Redshift

Erweitern Sie die Breite der Datenquellen, welche Sie in Ihren Rich-Analytik- und Machine-Learning-Anwendungen (ML) verwenden können, indem Sie Daten aus Ihrem Data Warehouse lesen und in dieses schreiben.

Optimieren Sie den umständlichen und oft manuellen Prozess der Einrichtung nicht zertifizierter Konnektoren und JDBC-Treiber und reduzieren Sie die Vorbereitungszeit für Analytik- und ML-Aufgaben.

Verwenden Sie mehrere Pushdown-Funktionen wie Sortieren, Aggregieren, Begrenzen, Verbinden und Skalarfunktionen, damit nur relevante Daten aus dem Amazon Redshift Data Warehouse verschoben werden.

Funktionsweise

Verwenden Sie AWS-Services, um Apache-Spark-Anwendungen zu erstellen, die in Ihrem Data Warehouse von Amazon Reshift lesen und schreiben.

Vergrößern und Bildbeschreibung lesen

A diagram illustrating integration between AWS Glue, Amazon EMR, Amazon SageMaker, and Amazon Redshift using Amazon Redshift Integration for Apache Spark, enabling access to Redshift data through Apache Spark applications.

Anwendungsfälle

Erstellen Sie Apache-Spark-Anwendungen in Java, Scala und Python mit Apache-Spark-basierten AWS-Analytikservices.

Lesen und schreiben Sie Daten in und aus Amazon Redshift mit Amazon EMR, AWS Glue, SageMaker und AWS Analytik und ML-Services.

Verwenden Sie Amazon EMR oder AWS Glue, um Datenrahmencode aus Ihrer Apache-Spark-Aufgabe oder -Notebook zu übernehmen und eine Verbindung zu Amazon Redshift herzustellen.

Optimieren Sie Ihren Prozess ohne Installation oder Tests, mit verbesserter Sicherheit (IAM-basierte Anmeldeinformationen) und Betriebs-Pushdowns, sowie Parquet-Dateiformat für Leistung.

Kunden

Corey Johnson, Data Architect Manager bei Huron Consulting

Huron ist ein globales Unternehmen für Professional Services, das mit Kunden zusammenarbeitet, um das Mögliche in die Praxis umzusetzen, indem es solide Strategien entwickelt, Abläufe optimiert, die digitale Transformation beschleunigt und Unternehmen und ihre Mitarbeiter in die Lage versetzt, ihre Zukunft selbst in die Hand zu nehmen.

„Wir befähigen unsere Ingenieure, ihre Datenpipelines und Anwendungen mit Apache Spark unter Verwendung von Python und Scala zu erstellen. Wir wollten eine maßgeschneiderte Lösung, welche den Betrieb vereinfacht und schneller und effizienter für unsere Kunden bereitgestellt wird, und genau das bekommen wir mit der neuen Amazon Redshift-Integration für Apache Spark.“

Alcuin Weidus, Sr Principal Data Architect bei GE Aerospace

GE Aerospace ist ein globaler Anbieter von Strahltriebwerken, Komponenten und Systemen für Verkehrs- und Militärflugzeuge. Das Unternehmen entwirft, entwickelt und fertigt seit dem Ersten Weltkrieg Strahltriebwerke.

„GE Aerospace nutzt AWS Analytics und Amazon Redshift, um wichtige Geschäftseinblicke zu ermöglichen, die wichtige Geschäftsentscheidungen vorantreiben. Mit der Unterstützung für das automatische Kopieren von Amazon S3 können wir einfachere Datenpipelines erstellen, um Daten von Amazon S3 zu Amazon Redshift zu verschieben. Dies beschleunigt die Fähigkeit unserer Datenproduktteams, auf Daten zuzugreifen und Endbenutzern Einblicke zu liefern. Wir verbringen mehr Zeit mit der Wertschöpfung durch Daten und weniger Zeit mit Integrationen.“

Neema Raphael, Chief Data Officer bei Goldman Sachs

Die Goldman Sachs Group, Inc. ist ein führendes globales Finanzinstitut, das einem großen und diversifizierten Kundenstamm, zu dem Unternehmen, Finanzinstitute, Regierungen und Privatpersonen gehören, eine breite Palette von Finanzdienstleistungen in den Bereichen Investment Banking, Wertpapiere, Anlageverwaltung und Privatkundengeschäft anbietet.

„Unser Fokus liegt darauf, allen unseren Nutzern bei Goldman Sachs einen Self-Service-Zugriff auf Daten zu bieten. Über Legend, unsere Open-Source-Datenmanagement- und Governance-Plattform, ermöglichen wir es Benutzern, datenzentrische Anwendungen zu entwickeln und datengesteuerte Erkenntnisse zu gewinnen, während wir in der gesamten Finanzdienstleistungsbranche zusammenarbeiten. Mit der Amazon Redshift-Integration für Apache Spark wird unser Datenplattformteam in der Lage sein, mit minimalen manuellen Schritten auf Amazon-Redshift-Daten zuzugreifen – was Zero-Code-ETL ermöglicht, was unsere Fähigkeit erhöht, es Ingenieuren zu erleichtern, sich auf die Perfektionierung ihres Arbeitsablaufs zu konzentrieren, während sie vollständige und zeitnahe Informationen sammeln. Wir erwarten eine Leistungssteigerung von Anwendungen und eine verbesserte Sicherheit, da unsere Benutzer jetzt problemlos auf die neuesten Daten in Amazon Redshift zugreifen können.“

Ressourcen

Video

Sehen Sie sich das technische Video über Amazon-Redshift-Integration für Apache Spark an.

Jetzt ansehen

Blog

Lesen Sie den Blog-Beitrag zu Amazon-Redshift-Integration für Apache Spark.

Weitere Informationen

Dokumentation

Lesen Sie den Leitfaden zum technischen Management über Amazon-Redshift-Integration für Apache Spark.

Hier erkunden

Erste Schritte mit Amazon Redshift

Was ist Amazon Redshift?

Weitere Informationen

Spark-Amazon-Redshift-Konnektor in AWS Glue

Weitere Informationen

JDBC-Treiberversionen mit AWS-Glue-Unterstützung

Weitere Informationen

Haben Sie die gewünschten Informationen gefunden?

Ihr Feedback hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern

Amazon-Redshift-Integration für Apache Spark

Warum Amazon-Redshift-Integration für Apache Spark?

Vorteile von Amazon Redshift

Funktionsweise

Anwendungsfälle

Kunden

Corey Johnson, Data Architect Manager bei Huron Consulting

Alcuin Weidus, Sr Principal Data Architect bei GE Aerospace

Neema Raphael, Chief Data Officer bei Goldman Sachs

Ressourcen

Sehen Sie sich das technische Video über Amazon-Redshift-Integration für Apache Spark an.

Lesen Sie den Blog-Beitrag zu Amazon-Redshift-Integration für Apache Spark.

Lesen Sie den Leitfaden zum technischen Management über Amazon-Redshift-Integration für Apache Spark.

Erste Schritte mit Amazon Redshift

Was ist Amazon Redshift?

Spark-Amazon-Redshift-Konnektor in AWS Glue

JDBC-Treiberversionen mit AWS-Glue-Unterstützung

Haben Sie die gewünschten Informationen gefunden?

Lernen

Ressourcen

Entwickler

Hilfe

Amazon-Redshift-Integration für Apache Spark

Warum Amazon-Redshift-Integration für Apache Spark?

Vorteile von Amazon Redshift

Apache-Spark-Analytik mit Amazon-Redshift-Daten erweitern

Mit minimalem Setup auf Amazon-Redshift-Daten zugreifen

Leistung und Sicherheit mit einem Amazon-zertifizierten Konnektor erweitern

Funktionsweise

Anwendungsfälle

ETL-, ML- und interaktive Anwendungen erstellen

Mit Ihrem Data Warehouse in Amazon-Redshift verbinden

Führen Sie Abfragen in Sekunden aus

AWS-zertifizierter Konnektor zur sofortigen Verwendung

Kunden

Corey Johnson, Data Architect Manager bei Huron Consulting

Alcuin Weidus, Sr Principal Data Architect bei GE Aerospace

Neema Raphael, Chief Data Officer bei Goldman Sachs

Ressourcen

Sehen Sie sich das technische Video über Amazon-Redshift-Integration für Apache Spark an.

Lesen Sie den Blog-Beitrag zu Amazon-Redshift-Integration für Apache Spark.

Lesen Sie den Leitfaden zum technischen Management über Amazon-Redshift-Integration für Apache Spark.

Erste Schritte mit Amazon Redshift

Was ist Amazon Redshift?

Spark-Amazon-Redshift-Konnektor in AWS Glue

JDBC-Treiberversionen mit AWS-Glue-Unterstützung

Haben Sie die gewünschten Informationen gefunden?

Lernen

Ressourcen

Entwickler

Hilfe