Publicado en: Jan 11, 2022
Amazon EMR Studio es un entorno de desarrollo integrado (IDE) que facilita a los científicos e ingenieros de datos el desarrollo, la visualización y la corrección de aplicaciones de macrodatos y análisis escritas en R, Python, Scala y PySpark. Hoy nos complace presentar el Explorador de SQL, una característica del Workspace de EMR Studio que le permite explorar el catálogo de datos y ejecutar consultas SQL en clústeres de EMR desde EMR Studio. Esta versión del Explorador de SQL en EMR Studio admite la ejecución de consultas SQL de Amazon EMR en clústeres EC2 que ejecuten la versión 0.254.1 o superior.
Presto es un rápido motor de consulta SQL diseñado para realizar consultas analíticas e interactivas sobre grandes conjuntos de datos procedentes de orígenes múltiples. En el explorador de SQL, puede conectarse a Amazon EMR en clústeres EC2 con Presto instalado para ver y explorar el catálogo de datos. Los catálogos de datos admitidos incluyen AWS Glue Data Catalog y Hive Metastore autoalojado versión 3.1.2 o superior. El Explorador de SQL también le brinda un Editor para ejecutar consultas SQL, ver los resultados de una consulta en una tabla y descargarlos en un formato csv. También tiene la posibilidad de ejecutar múltiples instrucciones SQL a través de distintas pestañas del Editor. El explorador de SQL es compatible con las versiones 6.4.0 o superiores de Amazon EMR.
EMR Studio se encuentra disponible en las regiones: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Canadá (centro), Europa (Irlanda), Europa (Fráncfort), Europa (Londres), Europa (Estocolmo), Europa (París), Asia-Pacífico (Bombay), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Tokio) y América del Sur (São Paulo).
Para obtener más información sobre el Explorador de SQL en EMR Studio, consulte nuestra documentación. Para ver la característica en acción, vea este video de demostración.