Instâncias P5 de GPU única do Amazon EC2 já disponíveis

Publicado: 12 de ago de 2025

Hoje, a AWS anuncia o novo tamanho de instância P5 do Amazon Elastic Compute Cloud (Amazon EC2) com uma GPU NVIDIA H100 que permite às empresas dimensionar corretamente seus recursos de machine learning (ML) e computação de alta performance (HPC) com uma boa relação custo-benefício.

O novo tamanho da instância permite que os clientes comecem aos poucos e escalem em incrementos granulares, fornecendo um controle mais flexível sobre os custos de infraestrutura. Os clientes que desenvolvem grandes modelos de linguagem (LLMs) de pequeno a médio porte, como chatbots ou ferramentas especializadas de tradução de idiomas, agora podem executar tarefas de inferência de forma mais econômica. Os clientes também podem usar essas instâncias para implantar aplicações de HPC para descoberta farmacêutica, análise de fluxo de fluidos e modelagem financeira sem se comprometer com implantações de GPU caras e em grande escala.

As instâncias P5.4xlarge agora estão disponíveis por meio dos Blocos de Capacidade do Amazon EC2 para ML nas seguintes regiões da AWS: Leste dos EUA (Norte da Virgínia, Ohio), Oeste dos EUA (Oregon), Europa (Londres), Ásia-Pacífico (Mumbai, Sydney, Tóquio) e América do Sul (São Paulo). Essas instâncias podem ser compradas nas opções sob demanda, spot ou por meio de Savings Plans nas regiões Europa (Londres), Ásia-Pacífico (Mumbai, Jacarta, Tóquio) e América do Sul (São Paulo).

Para saber mais sobre as instâncias P5.4xlarge, acesse Instâncias P5 do Amazon EC2.