Publicado: Sep 28, 2023
As instâncias P5 do Amazon EC2 que oferecem a melhor performance no Amazon EC2 para aplicações de aprendizado profundo e computação de alta performance (HPC) agora estão disponíveis na região Leste dos EUA (Ohio).
Você pode usar as instâncias P5 para treinar e implantar grandes modelos de linguagem (LLMs) e modelos de difusão cada vez mais complexos que apoiam as aplicações de IA generativa mais exigentes. Isso inclui respostas a perguntas, geração de código, geração de vídeo e imagem, reconhecimento de fala e muito mais. Você também pode usar as instâncias P5 para implantar em grande escala aplicações de HPC exigentes de descoberta farmacêutica, análise sísmica, previsão do tempo e modelagem financeira.
As instâncias P5 contam com a tecnologia das GPUs NVIDIA H100 Tensor Core mais recente e fornecem performance de CPU duas vezes maior, memória de sistema duas vezes maior e armazenamento local quatro vezes maior em comparação com as instâncias baseadas em GPU da geração anterior. Elas fornecem recursos de aumento da escala horizontal líderes de mercado para treinamento distribuído e workloads de HPC altamente acopladas com até 3.200 Gbps de rede usando a tecnologia Elastic Fabric Adapter (EFA) de segunda geração. Para atender às necessidades dos clientes de grande escala com baixa latência, as instâncias P5 são implantadas nos UltraClusters do Amazon EC2, fornecendo interconexão sem bloqueio em escala de petabits em até 20.000 GPUs H100.
Com essa expansão regional, as instâncias P5 do Amazon EC2 agora estão disponíveis nas regiões Leste dos EUA (N. da Virgínia), Leste dos EUA (Ohio) e Oeste dos EUA (Oregon).
Para saber mais sobre instâncias P5, consulte Instâncias P5 do Amazon EC2.