Amazon SageMaker HyperPod introduz a depuração aprimorada de scripts de ciclo de vida

Publicado: 21 de jan de 2026

O Amazon SageMaker HyperPod agora oferece recursos aprimorados de solução de problemas para scripts de ciclo de vida, o que facilita a identificação e a resolução de problemas durante o provisionamento dos nós do cluster. O SageMaker HyperPod ajuda você a provisionar clusters resilientes para executar workloads de IA/ML e desenvolver modelos de última geração, como grandes modelos de linguagem (LLMs), modelos de difusão e modelos de base (FMs).

Quando os scripts do ciclo de vida encontram problemas durante a criação do cluster ou as operações do nó, agora você recebe mensagens de erro detalhadas que incluem os nomes específicos do grupo de logs e do fluxo de logs do CloudWatch, nos quais você pode encontrar os logs de execução para scripts de ciclo de vida. Você pode visualizar essas mensagens de erro ao executar a API DescribeCluster ou visualizar a página de detalhes do cluster no console do SageMaker. O console também fornece um botão “Exibir registros do script do ciclo de vida” que navega diretamente para o fluxo de logs relevante do CloudWatch, o que facilita a localização dos logs. Além disso, os logs do CloudWatch para scripts de ciclo de vida agora incluem marcadores específicos para ajudar você a acompanhar o progresso da execução do script do ciclo de vida, incluindo indicadores de quando o log do script do ciclo de vida começa, quando os scripts estão sendo baixados, quando os downloads são concluídos e quando os scripts são bem-sucedidos ou falham. Esses marcadores ajudam você a identificar rapidamente onde os problemas ocorreram durante o processo de provisionamento. Esses aprimoramentos reduzem o tempo necessário para diagnosticar e corrigir falhas de scripts do ciclo de vida, o que ajuda você a colocar mais rapidamente seus clusters do HyperPod em funcionamento.

Esse atributo está disponível em todas as regiões da AWS nas quais o Amazon SageMaker HyperPod é oferecido. Para saber mais, consulte SageMaker HyperPod cluster management no Guia do desenvolvedor do Amazon SageMaker.