Publicado en: Feb 10, 2023
Amazon EMR sin servidor es una opción sin servidor en Amazon EMR que facilita a los ingenieros y los científicos de datos la ejecución de marcos de análisis de macrodatos de código abierto sin la necesidad de configurar, administrar y escalar clústeres o servidores. Una aplicación EMR sin servidor utiliza internamente los procesos de trabajo para ejecutar sus cargas de trabajo y usted puede adaptar las diferentes configuraciones de los procesos de trabajo en función de las necesidades de su carga de trabajo. Anteriormente, la configuración de los procesos de trabajo de mayor tamaño disponible en EMR sin servidor consistía en 4 CPU virtuales con hasta 30 GB de memoria. Hoy nos complace presentar que EMR sin servidor ahora ofrece configuraciones de procesos de trabajo de 8 CPU virtuales con hasta 60 GB de memoria y 16 CPU virtuales con hasta 120 GB de memoria. Esto le permite ejecutar cargas de trabajo con uso más intensivo de computación o memoria en EMR sin servidor.
Los procesos de trabajo de mayor tamaño pueden ayudarlo a mejorar el tiempo de ejecución de sus trabajos. Si necesita fragmentación aleatoria, al utilizar procesos de trabajo de mayor tamaño puede reducir las transferencias de datos ineficientes entre ejecutores. En caso de que haya un sesgo de datos, los procesos de trabajo de mayor tamaño reducen las probabilidades de que produzcan errores por falta de memoria. Además, si necesita almacenar datos en memoria caché, los procesos de trabajo de mayor tamaño le permiten mejorar el rendimiento al admitir más almacenamiento en este tipo de memoria. Para aprovechar estas ventajas, le recomendamos que utilice procesos de trabajo de mayor tamaño en EMR sin servidor para sus cargas de trabajo de Spark e Hive que hacen uso intensivo de memoria o procesamiento.
Para obtener más información sobre las diferentes configuraciones de los procesos de trabajo, consulte nuestra documentación. Los procesos de trabajo de gran tamaño están disponibles en todas las regiones de AWS en las que está disponible EMR sin servidor.