Publicado: Feb 1, 2024
Hoje, a Amazon Web Services anuncia que os blocos de capacidade do Amazon Elastic Compute Cloud (Amazon EC2) para ML já gora oferecem suporte a instâncias P5 na região Leste dos EUA (Norte da Virgínia) e instâncias P4d nas regiões Leste dos EUA (Ohio) e Oeste dos EUA (Oregon). Você pode usar os blocos de capacidade do EC2 para reservar as altamente requisitadas instâncias de GPU em um Amazon EC2 UltraCluster em uma data futura pelo tempo necessário para executar workloads de machine learning (ML).
Os blocos de capacidade do EC2 permitem que você reserve capacidade de GPU com até oito semanas de antecedência por períodos de 1 a 14 dias em clusters de 1 a 64 instâncias (512 GPUs), oferecendo a flexibilidade de executar uma ampla variedade de workloads de ML. Eles são ideais para workloads de pré-treinamento e ajuste fino de curta duração, prototipagem rápida e absorção de picos na demanda de inferência. Os blocos de capacidade do EC2 oferecem conectividade de baixa latência e alto throughput por meio de colocalização em Amazon EC2 UltraClusters.
Com essa expansão, os blocos de capacidade do EC2 para ML estão disponíveis para o público em geral para os seguintes tipos de instância e regiões da AWS: instâncias P5 nas regiões Leste dos EUA (Norte da Virgínia) e Leste dos EUA (Ohio); e instâncias P4d nas regiões Leste dos EUA (Ohio) e Oeste dos EUA (Oregon).
Para começar a usar, acesse o Console de Gerenciamento da AWS, a AWS Command Line Interface (AWS CLI) e os AWS SDKs. Para saber mais, consulte o Guia do usuário dos blocos de capacidade do Amazon EC2 para ML.