Governança de tarefas já disponível para o Amazon SageMaker HyperPod

Publicado: 4 de dez de 2024

O Amazon SageMaker HyperPod agora oferece governança centralizada em todas as tarefas de desenvolvimento de IA generativa, como treinamento e inferência. Você tem total visibilidade e controle sobre a alocação de recursos computacionais, garantindo que as tarefas mais críticas sejam priorizadas e maximizando a utilização dos recursos computacionais, reduzindo os custos de desenvolvimento de modelos em até 40%.

Com a governança de tarefas do HyperPod, os administradores podem definir com mais facilidade as prioridades para diferentes tarefas e estabelecer limites para quantos recursos computacionais cada equipe pode usar. A qualquer momento, os administradores também podem monitorar e auditar as tarefas que estão em execução ou aguardando recursos de computação por meio de um painel visual. Quando os cientistas de dados criam suas tarefas, o HyperPod as executa automaticamente, respeitando os limites e as prioridades dos recursos de computação definidos. Por exemplo, quando o treinamento para um modelo de alta prioridade precisar ser concluído o mais rápido possível, mas todos os recursos computacionais estiverem em uso, o HyperPod liberará recursos de tarefas de baixa prioridade para oferecer suporte ao treinamento. O HyperPod pausa a tarefa de baixa prioridade, salva o ponto de verificação e realoca os recursos computacionais liberados. A tarefa preemptiva de baixa prioridade será retomada a partir do último ponto de verificação salvo à medida que os recursos ficarem disponíveis novamente. E quando uma equipe não está usando totalmente os limites de recursos estabelecidos pelo administrador, o HyperPod usa esses recursos ociosos para acelerar as tarefas de outra equipe. Além disso, o HyperPod agora está integrado ao Amazon SageMaker Studio, trazendo a governança de tarefas e outros recursos do HyperPod para o ambiente do Studio. Os cientistas de dados agora podem interagir perfeitamente com os clusters do HyperPod diretamente do Studio, permitindo desenvolver, enviar e monitorar os trabalhos de machine learning (ML) em poderosos clusters apoiados por aceleradores.

A governança de tarefas do HyperPod está disponível em todas as regiões da AWS que oferecem o HyperPod: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (N. da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Europa (Frankfurt), Europa (Irlanda), Europa (Londres), Europa (Estocolmo) e América do Sul (São Paulo).

Para saber mais, acesse a página do SageMaker HyperPod, o blog de notícias da AWS e a documentação da IA do SageMaker.