Amazon SageMaker AI agora oferece suporte a P6e-GB200 UltraServers

Publicado: 12 de ago de 2025

Hoje, o Amazon SageMaker AI anuncia o suporte para P6e-GB200 UltraServers no SageMaker HyperPod e em tarefas de treinamento. Com o P6e-GB200 UltraServers, você pode aproveitar até 72 GPUs NVIDIA Blackwell em um domínio NVLink para acelerar o treinamento e a implantação de modelos de base em uma escala de trilhões de parâmetros. O P6e-GB200 UltraServers está disponível em dois tamanhos: ml.u-p6e-gb200x72 (72 GPUs no NVLink) e ml.u-p6e-gb200x36 (36 GPUs no NVLink).

O P6e-GB200 UltraServers oferece mais de 20 vezes mais computação e mais de 11 vezes mais memória com um NVIDIA NVLink em comparação às instâncias P5en. Em cada domínio NVLink, você pode aproveitar 360 petaflops de computação FP8 (sem escassez) e 13,4 TB de memória total de alta largura de banda (HBM3e). Ao usar o P6e-GB200 UltraServers no SageMaker AI, você obtém a performance superior do GB200 combinado com a infraestrutura gerenciada do SageMaker, como segurança, tolerância a falhas incorporada, agendamento com reconhecimento de topologia (SageMaker HyperPod EKS e Slurm), recursos de monitoramento integrados e integração nativa com outros serviços do SageMaker AI e da AWS.

O UltraServers está disponível por meio dos planos de treinamento flexíveis do SageMaker na zona local de Dallas (“us-east-1-dfw-2a”), uma extensão da região da AWS Leste dos EUA (Norte da Virgínia). Para reservas sob demanda do GB200 UltraServers, entre em contato com seu gerente de conta. O Amazon SageMaker AI permite treinar facilmente os modelos de machine learning em grande escala usando uma infraestrutura totalmente gerenciada otimizada para performance e custo. Para começar a usar o UltraServers no SageMaker AI, acesse a documentação.