Amazon EMR

Einfache Ausführung und Skalierung von Apache Spark, Hive, Presto und anderen Big-Data-Workloads

Führen Sie Big-Data-Anwendungen und Daten-Analysen im Petabyte-Bereich schneller und zu weniger als der Hälfte der Kosten von On-Premises-Lösungen aus.

Entwickeln Sie Anwendungen mithilfe des aktuellsten Open-Source-Frameworks, die auf benutzerdefinierten Amazon-EC2-Clustern, Amazon EKS, AWS Outposts oder Amazon EMR Serverless laufen können.

Erreichen Sie bis zu 2x- schnellere Zeit-zur-Erkenntnis mit leistungsoptimierten und Open-Source-API-kompatiblen, Versionen von Spark, Hive und Presto.

Entwickeln, visualisieren und debuggen Sie Ihre Anwendungen mithilfe von EMR Notebooks und bekannten Open-Source-Tools in EMR Studio.

Funktionsweise

Amazon EMR ist eine Cloud-Big-Data-Plattform, die von Kunden verwendet wird, um groß angelegte verteilte Datenverarbeitungsaufträge, interaktive SQL-Abfragen und Anwendungen für Machine Learning (ML) mit Open-Source-Analyse-Frameworks wie Apache Spark, Apache Hive und Presto auszuführen.

Wie Amazon EMR funktioniert
 Zum Vergrößern klicken
Einführung in EMR Serverless (2:02)
Einführung in Amazon EMR Serverless
Amazon EMR Serverless ist eine neue Option in Amazon EMR, mit der Dateningenieure und Analysen einfach und kostengünstig Anwendungen ausführen können, die mit Open-Source-Big-Data-Frameworks wie Apache Spark, Hive oder Presto entwickelt wurden, ohne dass Cluster optimiert, betrieben, gesichert oder verwaltet werden müssen.
Einführung in Amazon EMR Serverless
Amazon EMR Serverless ist eine neue Option in Amazon EMR, mit der Dateningenieure und Analysen einfach und kostengünstig Anwendungen ausführen können, die mit Open-Source-Big-Data-Frameworks wie Apache Spark, Hive oder Presto entwickelt wurden, ohne dass Cluster optimiert, betrieben, gesichert oder verwaltet werden müssen. EMR Serverless skaliert Computing- und Speicherressourcen entsprechend den Bedürfnissen Ihrer Anwendung nach oben oder unten, und Sie zahlen nur für Ressourcen, die von Ihrer Anwendung genutzt werden.

Anwendungsfälle

Big-Data-Analytik durchführen

Führen Sie mithilfe von statistischen Algorithmen und Prognose-Modellen Daten-Verarbeitung auf großer Skala und What-If-Analysen durch, um versteckte Muster, Korrelationen, Markttrends und Kundenvorlieben zu erkennen.

Aufbauen von skalierbaren Data Pipelines

Extrahieren Sie Daten aus einer Vielzahl von Quellen, verarbeiten Sie sie in großem Umfang, und stellen Sie sie sowohl für Anwendungen als auch für Benutzer zur Verfügung.

Verarbeiten von Echtzeit-Data-Streams

Analysieren Sie Ereignisse aus Streaming-Datenquellen in Echtzeit, um langlaufende, hochverfügbare und fehlertolerante Streaming-Data-Pipelines zu erstellen.

Beschleunigung der Datenwissenschaft und ML-Anwendung

Analysieren Sie Daten in EMR integrierten Open-Source-ML-Frameworks wie Apache Spark MLlib, TensorFlow und Apache MXNet. Verbinden Sie sich mit Amazon SageMaker Studio für Modelltraining, Analyse und Berichte auf großer Skala.

Erste Schritte

Erfahren Sie, wie Amazon EMR funktioniert

Erfahren Sie mehr über die Bereitstellung von Clustern, die Skalierung von Ressourcen, die Konfiguration von Hochverfügbarkeit und vieles mehr.

Entdecken Sie Amazon-EMR-Funktionen »

Entdecken Sie Amazon-EMR-Preise

Rechnen Sie sekundengenau ab und nutzen Sie die Option, EMR-Cluster auf Amazon EC2, Amazon EKS, AWS Outposts oder Amazon EMR Serverless zu betreiben.

Weitere Informationen zu Amazon-EMR-Preise »

Erste Schritte mit Amazon EMR

Erfahren Sie mehr über Stream-Verarbeitung in Echtzeit, Machine Learning im großen Maßstab und vieles mehr mit EMR.

Sehen Sie sich die Amazon-EMR-Tutorials an »

Entdecken Sie mehr von AWS