Publicado en: Nov 30, 2021

Nos complace anunciar la versión preliminar de Amazon EMR sin servidor, una nueva opción sin servidor en Amazon EMR que facilita y hace que sea rentable para ingenieros de datos y analistas ejecutar análisis de datos a escala de petabytes en la nube. Amazon EMR es una plataforma de big data en la nube utilizada por clientes que ejecutan trabajos de procesamiento de datos distribuidos a gran escala, consultas SQL interactivas y aplicaciones de machine learning con marcos de análisis de código abierto como Apache Spark, Apache Hive y Presto. Gracias a EMR sin servidor, los clientes pueden ejecutar aplicaciones diseñadas con esos marcos con tan solo unos clics, sin tener que configurar, optimizar o asegurar clústeres. EMR sin servidor aprovisiona y escala de manera automática los recursos informáticos y de memoria que requiere la aplicación, y los clientes solo pagan por los recursos que utilizan.

Gracias a EMR sin servidor, solo tiene que especificar el marco de código abierto y la versión que quiere utilizar para su aplicación y enviar trabajos mediante API, EMR Studio o clientes JDBC/ODBC. EMR sin servidor determina y aprovisiona de manera automática los recursos informáticos y de memoria requeridos para procesar solicitudes y escala los recursos horizontal o verticalmente en diferentes etapas del procesamiento según cambien los requisitos. Por ejemplo, un trabajo de Spark puede necesitar dos ejecutores para los primeros 5 minutos, 10 ejecutores para los próximos 10 minutos y 5 ejecutores para los últimos 20 minutos para procesar sus datos.  EMR sin servidor aprovisiona y ajusta de manera automática los recursos necesarios, de modo que no tiene que preocuparse de los cambios de volúmenes de datos a lo largo del tiempo. Y, puesto que solo paga por los recursos utilizados, EMR sin servidor es rentable para la ejecución de análisis a escala de petabytes. Los clientes pueden comprobar el estado de los trabajos en ejecución, revisar el historial de trabajos y utilizar herramientas de código abierto familiares para depurar trabajos con EMR Studio.

Amazon EMR sin servidor está disponible en versión preliminar en la región Este de EE. UU. (Norte de Virginia). Haga clic aquí para registrarse en la versión preliminar, y lea el blog o consulte la documentación para obtener más información.