Veröffentlicht am: Jan 11, 2022

Amazon EMR Studio ist eine integrierte Entwicklungsumgebung (IDE), die es Datenwissenschaftlern und Dateningenieuren leicht macht, Big-Data- und Analytik-Anwendungen zu entwickeln, zu visualisieren und zu debuggen, die in R, Python, Scala und PySpark geschrieben wurden. Heute freuen wir uns, SQL Explorer vorzustellen, eine Funktion in Ihrem EMR-Studio-Arbeitsbereich, mit der Sie den Datenkatalog durchsuchen und SQL-Abfragen auf EMR-Clustern über EMR Studio ausführen können. Diese Version von SQL Explorer in EMR Studio unterstützt die Ausführung von SQL-Abfragen für Amazon EMR auf EC2-Clustern mit Presto Version 0.254.1 oder höher. 

Presto ist eine schnelle SQL-Abfrage-Engine, die für interaktive analytische Abfragen über große Datensätze aus mehreren Quellen entwickelt wurde. In SQL Explorer können Sie eine Verbindung mit Amazon EMR in EC2-Clustern herstellen, auf denen Presto installiert ist, um den Datenkatalog anzuzeigen und zu durchsuchen. Zu den unterstützten Datenkatalogen gehören der AWS-Glue-Datenkatalog und der selbstgehostete Hive Metastore Version 3.1.2 oder höher. SQL Explorer bietet Ihnen auch einen Editor zum Ausführen von SQL-Abfragen, zum Anzeigen der Abfrageergebnisse in einer Tabelle und zum Herunterladen von Abfrageergebnissen im CSV-Format. Sie haben auch die Möglichkeit, mehrere SQL-Anweisungen über verschiedene Editor-Registerkarten auszuführen. SQL Explorer wird für Amazon-EMR-Versionen ab 6.4.0 unterstützt.

EMR Studio ist in den Regionen USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Kanada (Zentral), Europa (Irland), Europa (Frankfurt), Europa (London), Europa (Stockholm), Europa (Paris), Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio) und Südamerika (São Paulo) verfügbar.

Weitere Informationen zu SQL Explorer in EMR Studio finden Sie in unserer Dokumentation hier. Um die Funktion in Aktion zu sehen, sehen Sie sich das Demo-Video hier an.