Blocos de capacidade do Amazon EC2 se expandem para novas regiões
Hoje, a Amazon Web Services anuncia que os blocos de capacidade do Amazon Elastic Compute Cloud (Amazon EC2) para ML estão disponíveis para as instâncias P5 em duas novas regiões: Oeste dos EUA (Oregon) e Ásia-Pacífico (Tóquio). Você pode usar os blocos de capacidade do EC2 para reservar as altamente requisitadas instâncias de GPU em um Amazon EC2 UltraCluster em uma data futura pelo tempo necessário para executar workloads de machine learning (ML).
Os blocos de capacidade do EC2 permitem reservar capacidade da GPU com até oito semanas de antecedência por períodos de até 28 dias em clusters de 1 a 64 instâncias (512 GPUs), oferecendo a flexibilidade de executar uma ampla variedade de workloads de ML. Eles são ideais para workloads de pré-treinamento e ajuste fino de curta duração, prototipagem rápida e absorção de picos na demanda de inferência. Os blocos de capacidade do EC2 oferecem conectividade de baixa latência e alto throughput por meio de colocalização em Amazon EC2 UltraClusters.
Com essa expansão, os blocos de capacidade do EC2 para ML estão disponíveis para os seguintes tipos de instância e regiões da AWS: instâncias P5 em Leste dos EUA (N. da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon) e Ásia-Pacífico (Tóquio); instâncias P5e em Leste dos EUA (Ohio); instâncias P4d em Leste dos EUA (Ohio) e Oeste dos EUA (Oregon); instâncias Trn1 em Ásia-Pacífico (Melbourne).
Para começar a usá-los, acesse o Console de Gerenciamento da AWS, a AWS Command Line Interface (AWS CLI) e os AWS SDKs. Para saber mais, consulte o Guia do usuário dos blocos de capacidade do Amazon EC2 para ML.