Publicado: Nov 2, 2020

Temos o prazer de anunciar a disponibilidade das instâncias P4d do Amazon EC2, a última geração de instâncias baseadas em GPU, que oferecem a melhor performance para o treinamento de machine learning (ML) e computação de alta performance (HPC) na nuvem para aplicações como processamento de linguagem natural, detecção e classificação de objetos, análise sísmica e pesquisa genômica. As instâncias P4d contam com a tecnologia dos mais recentes GPUs do NVIDIA A100 Tensor Core e oferecem a primeira rede de instâncias de 400 Gbps na nuvem, com suporte para o Elastic Fabric Adapter (EFA) e acesso remoto direto à memória (RDMA) do GPUDirect do NVIDIA, proporcionando escalabilidade eficiente do treinamento de ML em vários nós, assim como cargas de trabalho HPC.

As instâncias P4d oferecem até 60% de redução dos custos de treinamentos e performance de aprendizado profundo 2,5 vezes melhor, com 2,5 vezes mais memória, o dobro da performance do ponto de flutuação de precisão dupla, largura de banda da rede 16 vezes maior e armazenamento SSD local baseado em NVMe 4 vezes melhor quando comparado às instâncias P3 da geração anterior.

As instâncias P4d são implantadas em clusters de hiperescala chamados UltraClusters EC2 e oferecem mais de 4.000 GPUs do NVIDIA A100, infraestrutura de rede sem bloqueio em escala de petabits e alta taxa de transferência, além de armazenamento de baixa latência com o FSx for Lustre. Esses UltraClusters EC2 estão entre os melhores supercomputadores do mundo. Eles democratizam o acesso diário à supercomputação para desenvolvedores, cientistas de dados e pesquisadores, sem nenhum custo de configuração ou manutenção. Usando os UltraClusters EC2, os desenvolvedores podem escalar o treinamento de ML de vários nós ou aplicações HPC para milhares de GPUs, a fim de solucionar seus problemas mais complexos, ou reduzir para apenas algumas instâncias, pagando somente pelas instâncias que forem usadas.

As instâncias P4d do Amazon EC2 são criadas no AWS Nitro System, uma coleção de inovações de hardware e software projetadas pela AWS que permite a entrega de serviços em nuvem eficientes, flexíveis e seguros com locação múltipla isolada, rede privada e armazenamento local rápido.

As instâncias P4d já estão disponíveis nas regiões Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon) da AWS. Elas estão disponíveis no tamanho p4d.24xl, fornecendo 96 vCPUs, 8 GPUs do NVIDIA A100, 1,1 TB de memória da instância, 8 TB de armazenamento SSD baseado em NVMe local, 400 Gbps de largura de banda da rede com EFA e GPUDirect RDMA, além de largura de banda de pico do EBS de 19 Gbps. As instâncias P4d podem ser adquiridas sob demanda, como parte de Savings Plans, como instâncias reservadas ou como instâncias spot.

Serviços conhecidos da AWS para ML e orquestração, como Amazon SageMaker, Amazon Elastic Kubernetes Service (EKS), Amazon Elastic Container Service (ECS), AWS ParallelCluster e AWS Batch, passarão a ser oferecidos nas instâncias P4d nas próximas semanas. Tanto clientes de empresas da Fortune 500 como startups, incluindo o Toyota Research Institute, a GE Healthcare e a Aon PathWise, participaram do programa de demonstração e estão adotando instâncias P4d para reduzir o tempo de treinamento e os custos do treinamento de modelos de ML. Para começar a usar instâncias P4d do Amazon EC2, acesse o Console de Gerenciamento da AWS, a Interface de Linhas de Comando (CLI) da AWS ou os SDKs da AWS. Para saber mais, acesse a página de visão geral ou a página de detalhes do produto.