SageMaker HyperPod já oferece suporte à alocação detalhada de cotas de recursos de computação

Publicado: 14 de ago de 2025

Agora, a governança de tarefas do SageMaker HyperPod oferece suporte à alocação detalhada de cotas de computação de GPU, acelerador Trainium, vCPU e memória de vCPU em uma instância. Os administradores podem alocar cotas de computação detalhadas entre as equipes, otimizando a distribuição de recursos computacionais sem exceder o orçamento.

Geralmente, os cientistas de dados executam tarefas de LLM, como treinamento ou inferência, que não exigem instâncias inteiras do HyperPod, o que causa a subutilização de recursos computacionais acelerados. A governança de tarefas do HyperPod permite que os administradores gerenciem a alocação de cotas computacionais entre as equipes. Com esse recurso, os administradores já podem alocar estrategicamente recursos computacionais, garantindo acesso justo, evitando a monopolização de recursos e maximizando a utilização do cluster. Esse recurso permite a alocação detalhada de cotas de computação, além da alocação de instâncias, de forma alinhada às demandas de workloads organizacionais.

A governança de tarefas do SageMaker HyperPod está disponível em todas as regiões da AWS que oferecem o HyperPod: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (N. da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Europa (Frankfurt), Europa (Irlanda), Europa (Londres), Europa (Estocolmo) e América do Sul (São Paulo).

Para saber mais, acesse a página do SageMaker HyperPod e a documentação de governança de tarefas do HyperPod.