Veröffentlicht am: Jan 11, 2022
Amazon EMR Studio ist eine integrierte Entwicklungsumgebung (IDE), die es Datenwissenschaftlern und Dateningenieuren leicht macht, Big-Data- und Analytik-Anwendungen zu entwickeln, zu visualisieren und zu debuggen, die in R, Python, Scala und PySpark geschrieben wurden. Heute freuen wir uns, SQL Explorer vorzustellen, eine Funktion in Ihrem EMR-Studio-Arbeitsbereich, mit der Sie den Datenkatalog durchsuchen und SQL-Abfragen auf EMR-Clustern über EMR Studio ausführen können. Diese Version von SQL Explorer in EMR Studio unterstützt die Ausführung von SQL-Abfragen für Amazon EMR auf EC2-Clustern mit Presto Version 0.254.1 oder höher.
Presto ist eine schnelle SQL-Abfrage-Engine, die für interaktive analytische Abfragen über große Datensätze aus mehreren Quellen entwickelt wurde. In SQL Explorer können Sie eine Verbindung mit Amazon EMR in EC2-Clustern herstellen, auf denen Presto installiert ist, um den Datenkatalog anzuzeigen und zu durchsuchen. Zu den unterstützten Datenkatalogen gehören der AWS-Glue-Datenkatalog und der selbstgehostete Hive Metastore Version 3.1.2 oder höher. SQL Explorer bietet Ihnen auch einen Editor zum Ausführen von SQL-Abfragen, zum Anzeigen der Abfrageergebnisse in einer Tabelle und zum Herunterladen von Abfrageergebnissen im CSV-Format. Sie haben auch die Möglichkeit, mehrere SQL-Anweisungen über verschiedene Editor-Registerkarten auszuführen. SQL Explorer wird für Amazon-EMR-Versionen ab 6.4.0 unterstützt.
EMR Studio ist in den Regionen USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Kanada (Zentral), Europa (Irland), Europa (Frankfurt), Europa (London), Europa (Stockholm), Europa (Paris), Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio) und Südamerika (São Paulo) verfügbar.