UltraClusters do Amazon EC2
Execute aplicações de HPC e ML em grande escala
Por que usar UltraClusters do Amazon EC2?
Os Amazon Elastic Compute Cloud (Amazon EC2) UltraClusters podem ajudar você a escalar para milhares de GPUs ou chips de IA de ML especialmente concebidos, como o AWS Trainium, para obter acesso sob demanda a um supercomputador. Eles democratizam o acesso à performance de classe de supercomputação para desenvolvedores de machine learning (ML), IA generativa e computação de alta performance (HPC) por meio de um modelo de uso simples com pagamento conforme o uso, sem custos de configuração ou manutenção. As instâncias do Amazon EC2 implantadas no EC2 UltraClusters incluem instâncias P6e-GB200, P6-B200, P5en, P5e, P5, P4d, Trn2 e Trn1.
Os UltraClusters do EC2 consistem em milhares de instâncias aceleradas do EC2 que estão localizadas em uma determinada zona de disponibilidade da AWS e interconectadas usando a rede Elastic Fabric Adapter (EFA) em uma rede sem bloqueio em escala de petabits. Os UltraClusters do EC2 também fornecem acesso ao Amazon FSx for Lustre, um armazenamento compartilhado totalmente gerenciado baseado no sistema de arquivos paralelo de alto desempenho mais popular para processar rapidamente grandes conjuntos de dados sob demanda e em escala com latências inferiores a um milissegundo. Os UltraClusters do EC2 oferecem recursos de aumento de escala horizontal para treinamento distribuído de ML e workloads de HPC de forte acoplamento.
Benefícios
Tempo de solução mais rápido para treinamento distribuído e HPC
Acesso sob demanda a um supercomputador em exaescala
Flexibilidade para otimizar a performance e os custo
Recursos
Rede de alta performance
Armazenamento de alta performance
Instâncias e UltraServers com suporte
UltraServers P6e-GB200
Aceleradas pela NVIDIA GB200 NVL72, as instâncias P6e-GB200 em uma configuração UltraServer oferecem a mais alta performance de treinamento e inferência de IA por GPU no Amazon EC2.
Instâncias P6-B200
As instâncias do Amazon EC2 P6-B200, aceleradas pelas GPUs NVIDIA Blackwell, oferecem instâncias de alto desempenho para treinamento em IA, inferência e HPC.
Instâncias Trn2 e UltraServers
Equipadas com chips de IA AWS Trainium2, as instâncias Trn2 oferecem um custo-benefício de 30 a 40% melhor do que instâncias comparáveis baseadas em GPU.
Instâncias P5en, P5e e P5
Alimentadas pelas GPUs NVIDIA H200 Tensor Core, as instâncias P5en e P5e oferecem a mais alta performance no Amazon EC2 para treinamento de ML e aplicações de HPC. As instâncias P5 são alimentadas por GPUs NVIDIA H100 Tensor Core.
Instâncias P4d
Equipadas com GPUs NVIDIA A100 Tensor Core, as instâncias P4d oferecem alta performance para treinamento de ML e aplicações de HPC.
Instâncias Trn1
Alimentadas pelos chips de IA AWS Trainium, as instâncias Trn1 são criadas especificamente para treinamento de ML de alta performance. Elas oferecem até 50% de economia de custos de treinamento em relação a instâncias EC2 comparáveis.
Você encontrou o que estava procurando hoje?
Informe-nos para que possamos melhorar a qualidade do conteúdo em nossas páginas