Instâncias P5en do Amazon EC2 já disponíveis na região da AWS Oeste dos EUA (N. da Califórnia)

Publicado: 6 de mai de 2025

A partir de hoje, as instâncias P5en do Amazon Elastic Compute Cloud (Amazon EC2) equipadas com GPUs H200 da NVIDIA estão disponíveis na região da AWS Oeste dos EUA (N. da Califórnia). Essas instâncias são otimizadas para aplicações de IA generativa e computação de alta performance (HPC).

As instâncias P5en contam com 8 GPUs H200 com 1,7x mais memória de GPU e 1,4x mais largura de banda de memória de GPU do que as GPUs H100 das instâncias P5. As instâncias P5en combinam as GPUs H200 com os processadores escaláveis Intel Xeon de 4a geração personalizados e de alta performance, permitindo o PCIe de 5ª geração entre a CPU e a GPU, o que fornece até 4x mais largura de banda entre a CPU e a GPU e aumenta a performance de treinamento e inferência de IA. O P5en, com até 3200 Gbps de terceira geração do EFA usando o Nitro v5, mostra uma melhoria de até 35% na latência em comparação com o P5 que usa a geração anterior do EFA e do Nitro. Isso ajuda a melhorar a performance da comunicação coletiva para workloads de treinamento distribuídas, como aprendizado profundo, IA generativa, processamento de dados em tempo real e aplicações de computação de alta performance (HPC). Para atender às necessidades dos clientes por grande escala com baixa latência, as instâncias P5en são implantadas nos Amazon EC2 UltraClusters e fornecem recursos de aumento horizontal da escala líderes de mercado para treinamento distribuído e workloads de HPC fortemente acopladas.

Para saber mais sobre instâncias P5en, consulte Instâncias P5en do Amazon EC2.