AWS Parallel Computing Service (PCS) já oferece suporte ao Slurm versão 25.05
Serviço de Computação Paralela da AWS (AWS PCS) já oferece suporte ao Slurm versão 25.05 Agora, você pode criar clusters do AWS PCS executando a versão mais recente do Slurm 25.05.
O lançamento do Slurm v25.05 no PCS fornece novas funcionalidades do Slurm, incluindo configuração aprimorada de sackd de vários clusters e melhor comportamento de reagendamento em caso de falhas de inicialização de instâncias. Com esse lançamento, os nós de login agora podem controlar vários clusters sem precisar reconfigurar ou reiniciar o sackd. Isso permite que os administradores pré-configurem o acesso a vários clusters para seus usuários. O novo comportamento de reagendamento permite um agendamento de tarefas mais resiliente ao automaticamente tentar executar novamente as instâncias com falha durante a falta de capacidade, aumentando assim a confiabilidade geral do cluster.
O AWS PCS é um serviço gerenciado que facilita a execução e a escalabilidade de suas workloads de computação de alta performance (HPC) na AWS usando o Slurm. Para saber mais sobre o PCS, consulte a documentação do serviço e a tabela de regiões da AWS.