Publicado en: Dec 9, 2020

Hoy anunciamos el avance público de EMR Studio, un entorno de desarrollo integrado (IDE) que facilita a los científicos e ingenieros de datos el desarrollo, la visualización y la depuración de aplicaciones de ingeniería y ciencia de datos escritas en R, Python, Scala y PySpark. EMR Studio proporciona bloc de notas Jupyter completamente administrados, y herramientas como Spark UI y YARN Timeline Service para simplificar la depuración.

EMR Studio utiliza AWS SSO y le permite acceder directamente con sus credenciales corporativas sin necesidad de entrar en la consola de AWS. Los científicos y analistas de datos pueden instalar kernels y librerías personalizadas, colaborar con sus colegas mediante el uso de repositorios de código como GitHub y BitBucket, o ejecutar blocs de notas parametrizados como parte de flujos de trabajo programados mediante servicios de orquestación como Apache Airflow o Amazon Managed Workflows for Apache Airflow.

Los núcleos y aplicaciones de EMR Studio se ejecutan en clústeres de EMR, por lo que obtiene el beneficio del procesamiento distribuido de datos al usar Amazon EMR runtime for Apache Spark. Los administradores pueden configurar EMR Studio de tal manera que los analistas puedan ejecutar sus aplicaciones en los clústeres existentes de EMR o crear nuevos clústeres mediante plantillas predefinidas de AWS CloudFormation para EMR. En EMR Studio, puede explorar todos los clústeres de EMR en un lugar central y limitarlos con filtros por ID de clúster, estado de clúster y otros parámetros. Con un solo clic, puede acceder al Spark History Server, al YARN Timeline Server o a la interfaz de usuario de Tez, que superpone el contexto de ejecución de los trabajos en los clústeres activos y terminados. 

EMR Studio está disponible en la versión 6.2 y posteriores de EMR, en las regiones de EE. UU. Este (Norte de Virginia), EE. UU. Oeste (Oregón), y la UE (Irlanda) para su presentación pública.

Para comenzar con la vista previa pública de EMR Studio, consulte la página de detalle de producto