Publicado: Sep 30, 2022
Temos o prazer de anunciar que o treinamento de modelos do Amazon SageMaker já oferece suporte ao SageMaker Training Managed Warm Pools. Agora, os usuários podem optar por manter as instâncias de hardware de treinamento de modelos de machine learning (ML) no estado warm por um período especificado após a conclusão do trabalho. Usando esse recurso, os clientes podem realizar experimentos interativos ou executar trabalhos consecutivos de treinamento de modelos em grande escala nas mesmas instâncias warm, reduzindo em até oito vezes a latência de inicialização dos trabalhos.
O treinamento de modelos do Amazon SageMaker é um recurso totalmente gerenciado que gera instâncias para um trabalho, treina um modelo e encerra as instâncias no final do trabalho. Os clientes são cobrados apenas pela duração do trabalho. Este recurso totalmente gerenciado permite que os clientes se concentrem no algoritmo de ML para treinar os modelos sem se preocupar com o gerenciamento de infraestrutura. No entanto, como instâncias de hardware são provisionadas para cada trabalho de treinamento, esse comportamento introduz a latência da inicialização em workloads de treinamento repetitivas. Considerando que o treinamento de modelos exige uma considerável experimentação iterativa, essa latência de inicialização de cada trabalho cria uma sobrecarga adicional para os clientes. Além disso, os clientes que gostam de treinar grandes volumes de modelos em grande escala geralmente usam as mesmas configurações de instâncias para trabalhos de treinamento consecutivos e ficam sujeitos ao incômodo da latência de inicialização para cada trabalho.
Com o SageMaker Training Managed Warm Pools, os clientes podem manter as instâncias de hardware de treinamento de modelos no estado warm por um período especificado após cada trabalho. Dessa forma, eles podem iniciar treinamentos usando uma instância já operacional para realizar experimentos iterativos ou treinar consecutivamente grandes volumes de modelos. O SageMaker Training Managed Warm Pools permite que os clientes reduzam a latência de inicialização de trabalhos de treinamento de modelos em até oito vezes. Os clientes podem ativar o SageMaker Training Managed Warm Pools especificando um período de espera (keep-alive) na API de treinamento. Os clientes que optarem por usar warm pools serão cobrados pelas instâncias e volumes do EBS durante o período de espera.
O SageMaker Training Managed Warm Pools está disponível em todas as regiões públicas da AWS em que o treinamento de modelos do Amazon SageMaker é oferecido. Para começar a usar, consulte Train Using SageMaker Managed Warm Pools no Guiai do desenvolvedor do Amazon SageMaker.