O AWS Parallel Computing Service oferece suporte às configurações slurmdbd e cgroups
O AWS Parallel Computing Service (AWS PCS) agora oferece suporte a configurações adicionais do Slurm para slurmdbd e cgroups, permitindo que você ajuste o comportamento contábil e o isolamento de recursos diretamente por meio do console, CLI ou SDK do AWS PCS. Esse recurso ajuda você a implementar ambientes de HPC prontos para produção com controles de privacidade aprimorados, políticas flexíveis de retenção de dados e gerenciamento aprimorado de recursos.
Usando as configurações do slurmdbd, você pode configurar como a contabilidade do Slurm opera em seu cluster, incluindo controles de privacidade, políticas de retenção de dados e recursos de rastreamento de carga de trabalho. Com o suporte a cgroups, você pode evitar o excesso de assinatura de recursos vinculando núcleos de CPU, impondo limites de memória para manter a estabilidade do nó e controlar o acesso ao dispositivo para garantir que as workloads sejam executadas dentro de limites definidos.
O PCS é um serviço gerenciado que simplifica a execução e a escalabilidade de workloads de computação de alta performance (HPC) na AWS usando o Slurm. Você pode criar ambientes completos e elásticos que integram ferramentas de computação, armazenamento, rede e visualização, enquanto o serviço lida com operações de cluster com atualizações gerenciadas e recursos integrados de observabilidade.
Esse atributo está disponível em todas as regiões da AWS que oferecem o AWS PCS. Você pode definir essas configurações ao criar um novo cluster ou ao modificar um cluster existente. Para saber mais, consulte o Guia do usuário do AWS PCS.