Veröffentlicht am: Nov 28, 2023
Mit Amazon EMR und der Speicherklasse Amazon S3 Express One Zone können Sie jetzt die Datenverarbeitung und -analyse mit Apache-Spark-Anwendungen im Vergleich zu Daten in S3 Standard um das bis zu 4,0-Fache beschleunigen. S3 Express One Zone ist eine leistungsstarke Speicherklasse für eine einzelne Availability Zone, die speziell dafür entwickelt wurde, für Ihre am häufigsten aufgerufenen Daten und latenzempfindlichen Anwendungen konsistenten Datenzugriff im einstelligen Millisekundenbereich zu ermöglichen.
Amazon EMR ist die branchenführende cloudbasierte Big-Data-Lösung für Datenverarbeitung, interaktive Analytik und Machine Learning in Open-Source-Frameworks, die für den Petabyte-Bereich in AWS optimiert sind. Wenn Sie leistungskritische Workloads mit Service Level Agreements (SLA) haben, z. B. für die zeitgerechte Erfüllung von Aufgaben für Data-Lake-Updates, oder wenn Sie schnelle Reaktionszeiten für BI-Dashboard-Berichte benötigen, verwenden Sie bei der Ausführung von EMR-Spark-Anwendungen in einem EC2-Cluster S3 Express One Zone.
S3 Express One Zone ist mit der Amazon-EMR-Version 6.15.0 in den AWS-Regionen verfügbar, in denen S3 Express One Zone verfügbar ist. Verschieben Sie zunächst Ihre Daten in den Speicher von S3 Express One Zone und verwenden Sie den S3a-Konnektor in Ihrem Spark-Code, um Daten zu lesen und zu schreiben. S3a ist der Konnektor, der von EMR zur Verarbeitung von S3-Objekten verwendet wird und für Buckets von S3 Express One Zone erforderlich ist. Weitere Informationen finden Sie unter Verwenden von EMR mit Daten in S3 Express One Zone in der Amazon-EMR-Dokumentation.