Amazon SageMaker HyperPod introduce il debug avanzato degli script del ciclo di vita

Inserito il: 21 gen 2026

Amazon SageMaker HyperPod offre ora funzionalità avanzate di risoluzione dei problemi per gli script del ciclo di vita, semplificando l'identificazione e la risoluzione dei problemi durante il provisioning dei nodi del cluster. SageMaker HyperPod aiuta a eseguire il provisioning di cluster resilienti per l'esecuzione di carichi di lavoro IA/ML e lo sviluppo di modelli all'avanguardia come modelli linguistici di grandi dimensioni (LLM), modelli di diffusione e modelli di fondazione (FM).

Quando gli script del ciclo di vita incontrano problemi durante la creazione del cluster o le operazioni sui nodi, ora ricevi messaggi di errore dettagliati che includono il gruppo di log specifico di CloudWatch e i nomi dei flussi di log in cui puoi trovare i log di esecuzione per gli script del ciclo di vita. È possibile visualizzare questi messaggi di errore eseguendo l'API DescribeCluster o visualizzando la pagina dei dettagli del cluster nella console SageMaker. La console fornisce anche un pulsante "Visualizza i log degli script del ciclo di vita" che consente di accedere direttamente al flusso di log CloudWatch pertinente, semplificando l'individuazione dei log. Inoltre, i log di CloudWatch per gli script del ciclo di vita ora includono indicatori specifici per aiutarti a monitorare l'avanzamento dell'esecuzione degli script del ciclo di vita, inclusi indicatori per l'inizio del log dello script del ciclo di vita, quando gli script vengono scaricati, quando i download sono completati e quando gli script hanno esito positivo o negativo. Questi indicatori consentono di identificare rapidamente dove si sono verificati i problemi durante il processo di provisioning. Questi miglioramenti riducono il tempo necessario per diagnosticare e correggere gli errori degli script del ciclo di vita, aiutandoti a rendere operativi i tuoi cluster HyperPod più velocemente.

Questa funzionalità è disponibile in tutte le regioni AWS in cui è supportato Amazon SageMaker HyperPod. Per saperne di più, consulta la sezione Gestione dei cluster SageMaker HyperPod nella guida per sviluppatori di Amazon SageMaker.