Publicado: Nov 1, 2023
Hoje, a AWS anuncia a disponibilidade geral dos blocos de capacidade do Amazon Elastic Compute Cloud (Amazon EC2) para machine learning. Você pode usar os blocos de capacidade do EC2 para reservar instâncias de GPU em um Amazon EC2 UltraCluster em uma data futura pelo tempo necessário para executar suas workloads de machine learning (ML). Essa é uma forma inovadora de reservar capacidade, na qual você pode programar instâncias de GPU para estarem disponíveis em uma data futura pelo tempo necessário para essas instâncias.
Os blocos de capacidade do EC2 fornecem acesso seguro e previsível às instâncias de GPU para suas workloads de ML. E com os blocos de capacidade do EC2 para ML, você obtém conectividade de baixa latência e alto throughput por meio de colocalização em Amazon EC2 UltraClusters para treinamento distribuído. Você pode reservar a capacidade da GPU entre 1 e 14 dias e em tamanhos de cluster com 1 a 64 instâncias (512 GPUs), oferecendo a flexibilidade de executar uma ampla variedade de workloads de ML. Isso inclui treinamento e ajuste de modelos de ML, prototipagem rápida e gerenciamento de picos na demanda futura. Os blocos de capacidade do EC2 podem ser reservados com até oito semanas de antecedência.
Os blocos de capacidade do EC2 agora estão disponíveis para reservar instâncias P5 do Amazon EC2, equipadas com as mais recentes GPUs NVIDIA H100 Tensor Core, na região da AWS Leste dos EUA (Ohio).
Para começar a usá-los, acesse o Console de Gerenciamento da AWS, a AWS Command Line Interface (AWS CLI) e os AWS SDKs. Para saber mais, consulte Blocos de capacidade do Amazon EC2 para machine learning e a documentação.