Instâncias P5en do Amazon EC2, otimizadas para IA generativa e HPC, já disponíveis

Publicado: 2 de dez de 2024

Hoje, a AWS anuncia a disponibilidade geral das instâncias P5en do Amazon Elastic Compute Cloud (Amazon EC2), equipadas com as mais recentes GPUs NVIDIA H200 Tensor Core. Essas instâncias oferecem a melhor performance no Amazon EC2 para aplicações de aprendizado profundo e computação de alta performance (HPC).

Você pode usar as instâncias P5en do Amazon EC2 para treinar e implantar os grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos usados pelas aplicações de IA generativa mais exigentes. Você também pode usar as instâncias P5en para implantar aplicações de HPC exigentes em grande escala nas áreas de descoberta farmacêutica, análise sísmica, previsão do tempo e modelagem financeira.

As instâncias P5en contam com até 8 GPUs H200 com 1,7x mais memória de GPU e 1,5x mais largura de banda de memória de GPU do que as GPUs H100 das instâncias P5. As instâncias P5en combinam as GPUs H200 com os processadores escaláveis Intel Xeon de 4a geração personalizados e de alta performance, permitindo o PCIe de 5ª geração entre a CPU e a GPU, o que fornece até 4x mais largura de banda entre a CPU e a GPU e aumenta a performance de treinamento e inferência de IA. O P5en, com até 3200 Gbps de terceira geração do EFA usando o Nitro v5, mostra uma melhoria de até 35% na latência em comparação com o P5 que usa a geração anterior do EFA e do Nitro. Isso ajuda a melhorar a performance da comunicação coletiva para workloads de treinamento distribuídas, como aprendizado profundo, IA generativa, processamento de dados em tempo real e aplicações de computação de alta performance (HPC). Para atender às necessidades dos clientes por grande escala com baixa latência, as instâncias P5en são implantadas nos Amazon EC2 UltraClusters e fornecem recursos de aumento horizontal da escala líderes de mercado para treinamento distribuído e workloads de HPC fortemente acopladas.

As instâncias P5en agora estão disponíveis nas regiões da AWS Leste dos EUA (Ohio), Oeste dos EUA (Oregon) e Ásia-Pacífico (Tóquio) e na zona local us-east-1-atl-2a em Leste dos EUA (Atlanta) com o tamanho p5en.48xlarge.

Para saber mais sobre instâncias P5en, consulte Instâncias P5en do Amazon EC2.