Publicado: Jun 29, 2023

O AWS Batch agora oferece suporte à especificação de um número mínimo de vCPUs (Min vCPUs) para trabalhos paralelos de vários nós (MNP). Os trabalhos MNP permitem que os usuários executem workloads estreitamente acopladas em grande escala, como treinamento de ML, em várias instâncias do Amazon Elastic Compute Cloud (Amazon EC2). Com esse lançamento, os clientes agora podem reter um número específico de vCPUs em um ambiente de computação (CE), mesmo quando não há trabalhos em execução. Esse atributo permite que os clientes mantenham um conjunto aquecido de instâncias íntegras para trabalhos de MNP, ajudando a evitar situações nas quais a capacidade seja devolvida ao EC2 devido à rápida redução de escala verticalmente.

Para configurar o “Min vCPUs” (Mínimo de vCPUs) para MNP, os clientes podem especificar o número desejado de “min vCPUs” por meio do console do AWS Batch ou usando a API CreateComputeEnvironment ou UpdateComputeEnvironment. O AWS Batch foi projetado para escalar e reter a capacidade de MNP até o nível definido pelo cliente e para manter o nível de capacidade mesmo quando todos os trabalhos são concluídos nesse ambiente de computação. Consulte o Guia do usuário do AWS Batch para obter mais detalhes sobre esse atributo.

Os trabalhos MNP permitem que os usuários executem workloads de computação em grande escala e de alta performance, como grandes modelos de linguagem, em várias instâncias do Amazon EC2. Ao estender o Min vCPUs para trabalhos MNP, os clientes podem facilmente identificar e manter instâncias íntegras para trabalhos futuros, eliminando a necessidade de tempos adicionais de inicialização e verificações de hardware antes da execução de cada trabalho. Esse atributo agora está disponível em todas as regiões da AWS nas quais o AWS Batch é oferecido no momento. Para saber mais sobre o AWS Batch, consulte o Guia do usuário do AWS Batch. Para saber mais sobre a API do AWS Batch, consulte a Referência de API do AWS Batch.