Publicado: Aug 4, 2023
Os trabalhos de treinamento do Amazon SageMaker já oferecem suporte a instâncias ml.p5 baseadas em chips NVIDIA H100, criados especificamente para aplicações de treinamento de ML de alta performance na nuvem. Você pode usar instâncias ml.p5 no SageMaker para treinar alguns dos modelos mais exigentes. Isso inclui grandes modelos de linguagem (LLMs) e modelos de difusão que apoiam as aplicações mais demandantes de IA generativa. Essas aplicações incluem respostas a perguntas, geração de código, geração de vídeo e imagem e reconhecimento de fala.
Atualmente, as instâncias ml.p5 oferecem até oito das mais recentes GPUs NVIDIA H100 Tensor Core. As instâncias P5 complementam as GPUs NVIDIA H100 Tensor Core com performance de CPU duas vezes maior, memória de sistema duas vezes maior e armazenamento local quatro vezes maior em comparação com as instâncias baseadas em GPU da geração anterior. Elas fornecem recursos de aumento da escala horizontal líderes de mercado para treinamento distribuído e workloads de HPC altamente acopladas com até 3.200 Gbps de rede usando a tecnologia Elastic Fabric Adapter (EFA) de segunda geração.
Hoje, o treinamento de modelos do SageMaker oferece suporte a instâncias ml.p5 do tamanho ml.p5.48xlarge nas regiões da AWS Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon).
Para ler mais sobre instâncias ml.p5, acesse a página de instâncias P5. Para começar a usar as instâncias ml.p5, faça login no console do Amazon SageMaker. Para saber mais sobre o treinamento de modelos do Amazon SageMaker, acesse a nossa página.