- Analytik›
- Amazon EMR›
- EMR Serverless
Amazon EMR Serverless
Big-Data-Anwendungen mit Open-Source-Frameworks ohne Verwaltung von Clustern und Servern ausführen
Warum EMR Serverless?
Amazon EMR Serverless ist eine Serverless-Option in Amazon EMR, die es Datenanalytikern und Engineers erleichtert, open-source Big-Data-Analytik-Frameworks auszuführen, ohne Cluster oder Server konfigurieren, verwalten und skalieren zu müssen. Sie erhalten alle Funktionen und Vorteile von Amazon EMR, ohne dass Experten für die Planung und Verwaltung von Clustern erforderlich sind.
Vorteile
Mit dem Upgrade-Agenten von Apache Spark werden monatelange Apache-Spark-Upgrades durch intelligente Automatisierung zu effizienten einwöchigen Projekten. Der Upgrade-Agent von Spark optimiert Unternehmensmigrationen, indem er komplexe API-Änderungen in Ihrer gesamten Codebasis automatisch verarbeitet und so Kosten und Aufwand erheblich reduziert.
Amazon EMR Serverless macht die Bereitstellung lokaler Speicher für Apache-Spark-Workloads überflüssig, senkt die Datenverarbeitungskosten um bis zu 20 % und verhindert Auftragsausfälle aufgrund von Beschränkungen der Festplattenkapazität. EMR Serverless führt automatisch Zwischenoperationen wie Shuffle durch, ohne dass Speichergebühren anfallen – Sie zahlen lediglich für Rechen- und Speicherressourcen.
Funktionsweise
1
Anwendung erstellen
Wählen Sie das Open-Source-Framework und die Version, die Sie verwenden möchten.
2
Aufträge einreichen
Übermitteln Sie Aufträge an Ihre Anwendung über APIs oder EMR Studio. Sie können Aufträge auch mithilfe von Workflow-Orchestrierungsservices wie Apache Airflow oder Amazon Managed Workflows for Apache Airflow einreichen.
3
Aufträge debuggen
Verwenden Sie vertraute Open-Source-Tools wie Spark UI und Tez UI, um Aufträge zu überwachen und zu debuggen.