Instâncias P5e do Amazon EC2 estão disponíveis para o público em geral por meio de blocos de capacidade do EC2
Hoje, a AWS anuncia a disponibilidade geral das instâncias P5e do Amazon Elastic Compute Cloud (Amazon EC2), equipadas com as mais recentes GPUs NVIDIA H200 Tensor Core. Disponíveis por meio de blocos de capacidade do EC2, essas instâncias oferecem a mais alta performance de aprendizado profundo e inferência de IA generativa no Amazon EC2.
Você pode usar as instâncias P5e do Amazon EC2 para treinar e implantar os grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos usados pelas aplicações de IA generativa mais exigentes. Você também pode usar as instâncias P5e para implantar aplicações de HPC exigentes em grande escala nas áreas de descoberta farmacêutica, análise sísmica, previsão do tempo e modelagem financeira.
As instâncias P5e contam com 8 GPUs H200 com 1,7x mais memória de GPU e 1,5x mais largura de banda de memória de GPU do que as GPUs H100 das instâncias P5. Elas fornecem recursos de aumento da escala horizontal líderes de mercado para treinamento distribuído e workloads de HPC altamente acopladas com até 3.200 Gbps de rede usando a tecnologia Elastic Fabric Adapter (EFA) de segunda geração. Para atender às necessidades dos clientes de grande escala com baixa latência, as instâncias P5e são implantadas nos UltraClusters do Amazon EC2.
As instâncias P5e já estão disponíveis na região da AWS Leste dos EUA (Ohio) nos tamanhos p5e.48xlarge por meio dos blocos de capacidade do EC2 para ML.
Para saber mais sobre instâncias P5e, consulte Instâncias P5e do Amazon EC2.