Amazon EMR Serverless

Ausführen von Big-Data-Anwendungen mit Open-Source-Frameworks ohne Verwaltung von Clustern und Servern

Warum EMR Serverless?

Amazon EMR Serverless ist eine Serverless-Option in Amazon EMR, die es Datenanalytikern und Engineers erleichtert, quelloffene Big-Data-Analytik-Frameworks auszuführen, ohne Cluster oder Server konfigurieren, verwalten und skalieren zu müssen. Sie erhalten alle Funktionen und Vorteile von Amazon EMR, ohne dass Experten für die Planung und Verwaltung von Clustern erforderlich sind.

Vorteile

Wählen Sie das Open-Source-Framework aus, das Sie für Ihre Anwendung ausführen möchten, z. B. Apache Spark und Apache Hive, und EMR Serverless stellt automatisch die zugrunde liegenden Rechen- und Speicherressourcen bereit und verwaltet sie.
Führen Sie Analytik-Workloads in jeder Größenordnung mit der automatischen On-Demand-Skalierung aus, bei der die Größe von Ressourcen innerhalb von Sekunden an wechselnde Datenmengen und Verarbeitungsanforderungen angepasst wird.
EMR Serverless skaliert Ressourcen automatisch nach oben und unten, um genau die richtige Menge an Kapazität für Ihre Anwendung bereitzustellen. Sie zahlen nur für das, was Sie tatsächlich nutzen, und Sie können Bedenken hinsichtlich einer übermäßigen oder nicht ausreichenden Bereitstellung minimieren.

Funktionsweise:

1

Anwendung erstellen

Wählen Sie das Open-Source-Framework und die Version, die Sie verwenden möchten.

2

Jobs einreichen

Übermitteln Sie Aufträge an Ihre Anwendung über APIs oder EMR Studio. Sie können Aufträge auch mithilfe von Workflow-Orchestrierungsservices wie Apache Airflow oder Amazon Managed Workflows for Apache Airflow einreichen.

3

Jobs debuggen

Verwenden Sie vertraute Open-Source-Tools wie Spark UI und Tez UI, um Aufträge zu überwachen und zu debuggen.

Anwendungsfälle

Wenn sich die Workload-Anforderungen ändern, skalieren Sie die Anwendungsressourcen nahtlos, ohne vorab konfigurieren zu müssen, wie viel Rechenleistung und Arbeitsspeicher Sie benötigen.
Wählen Sie die Option, um Anwendungsressourcen vorab zu initialisieren und die Reaktionszeit in Sekunden für SLA-sensitive Daten-Pipelines zu aktivieren.
Richten Sie schnell und einfach eine Entwicklungs- und Testumgebung ein, skalieren Sie automatisch bei unvorhersehbarer Nutzung und bringen Sie Produkte schneller auf den Markt.