Publicado en: Feb 9, 2023
Hoy presentamos una nueva función para Amazon EMR en EKS para aumentar la resiliencia de la ejecución de trabajos. Hasta ahora, los usuarios tenían que crear su propio mecanismo personalizado de reintento de ejecución de trabajos fuera de Amazon EMR en EKS para asegurarse de que sus trabajos de Spark siguieran ejecutándose en caso de error. Con esta función, los usuarios ahora pueden ahorrar tiempo y mantener en funcionamiento sus cargas de trabajo de streaming críticas para la empresa y de larga duración, al hacer que Amazon EMR en EKS vuelva a enviar los trabajos automáticamente en caso de error.
Con los reintentos de trabajos, una vez que defina una política de reintentos indicando la cantidad de intentos a los que se debe limitar las ejecuciones, Amazon EMR en EKS aplicará y supervisará esta política durante cada ejecución del trabajo, lo que le permitirá ver mediante la API DescribeJobRun y los eventos de AWS CloudWatch de cada reintento que se realice.
Los reintentos de ejecución de trabajos ya están disponibles de forma general en todas las regiones de AWS en las que se encuentra Amazon EMR en EKS, empezando por Amazon EMR 6.9 y versiones posteriores. Para obtener más información sobre cómo utilizar los reintentos del pod del controlador de tareas, consulte nuestra documentación.