Amazon SageMaker HyperPod introduce il debug avanzato degli script del ciclo di vita
Amazon SageMaker HyperPod offre ora funzionalità avanzate di risoluzione dei problemi per gli script del ciclo di vita, semplificando l'identificazione e la risoluzione dei problemi durante il provisioning dei nodi del cluster. SageMaker HyperPod aiuta a eseguire il provisioning di cluster resilienti per l'esecuzione di carichi di lavoro IA/ML e lo sviluppo di modelli all'avanguardia come modelli linguistici di grandi dimensioni (LLM), modelli di diffusione e modelli di fondazione (FM).
Quando gli script del ciclo di vita incontrano problemi durante la creazione del cluster o le operazioni sui nodi, ora ricevi messaggi di errore dettagliati che includono il gruppo di log specifico di CloudWatch e i nomi dei flussi di log in cui puoi trovare i log di esecuzione per gli script del ciclo di vita. È possibile visualizzare questi messaggi di errore eseguendo l'API DescribeCluster o visualizzando la pagina dei dettagli del cluster nella console SageMaker. La console fornisce anche un pulsante "Visualizza i log degli script del ciclo di vita" che consente di accedere direttamente al flusso di log CloudWatch pertinente, semplificando l'individuazione dei log. Inoltre, i log di CloudWatch per gli script del ciclo di vita ora includono indicatori specifici per aiutarti a monitorare l'avanzamento dell'esecuzione degli script del ciclo di vita, inclusi indicatori per l'inizio del log dello script del ciclo di vita, quando gli script vengono scaricati, quando i download sono completati e quando gli script hanno esito positivo o negativo. Questi indicatori consentono di identificare rapidamente dove si sono verificati i problemi durante il processo di provisioning. Questi miglioramenti riducono il tempo necessario per diagnosticare e correggere gli errori degli script del ciclo di vita, aiutandoti a rendere operativi i tuoi cluster HyperPod più velocemente.
Questa funzionalità è disponibile in tutte le regioni AWS in cui è supportato Amazon SageMaker HyperPod. Per saperne di più, consulta la sezione Gestione dei cluster SageMaker HyperPod nella guida per sviluppatori di Amazon SageMaker.