Publicado: Feb 9, 2023

Hoje, estamos introduzindo um novo recurso do Amazon EMR no EKS que aumenta a resiliência da execução de trabalhos. Até agora, os usuários precisavam criar seu próprio mecanismo personalizado de novas tentativas de execução de trabalhos fora do Amazon EMR no EKS para garantir a continuidade da execução de trabalhos do Spark em caso de falha. Agora, com este recurso, os usuários podem economizar tempo e manter workloads de streaming essenciais e de longa duração em execução, fazendo com que o Amazon EMR no EKS reenvie automaticamente os trabalhos em caso de falha.

Depois que uma política de novas tentativas de trabalho é definida, especificando a quantidade limite de tentativas de execução, o Amazon EMR no EKS aplica e monitora essa política durante a execução de cada trabalho, oferecendo visibilidade por meio da API DescribeJobRun e dos eventos do AWS CloudWatch de cada nova tentativa de execução. 

Agora, as novas tentativas de execução de tarefas estão disponíveis em todas as regiões da AWS onde o Amazon EMR (versão 6.9 e posteriores) no EKS é oferecido. Para saber mais sobre como usar as repetições do pod de driver dos trabalhos, acesse a documentação.