Amazon SageMaker HyperPod führt verbessertes Debugging für Lifecycle-Skripte ein
Amazon SageMaker HyperPod bietet jetzt erweiterte Fehlerbehebungsfunktionen für Lifecycle-Skripts, um Probleme bei der Bereitstellung von Cluster-Knoten einfacher zu identifizieren und zu beheben SageMaker HyperPod unterstützt Sie bei der Bereitstellung robuster Cluster für die Ausführung von KI/Machine Learning (ML)-Workloads und die Entwicklung hochmoderner Modelle wie große Sprachmodelle (LLMs), Diffusionsmodelle und Basismodelle (FMs).
Wenn Lifecycle-Skripts bei der Clustererstellung oder bei Knotenvorgängen auf Probleme stoßen, erhalten Sie jetzt detaillierte Fehlermeldungen, die die spezifischen Namen von CloudWatch-Protokollgruppen und -Protokollstreams enthalten, in denen Sie Ausführungsprotokolle für Lifecycle-Skripts finden. Sie können diese Fehlermeldungen anzeigen, indem Sie die DescribeCluster API ausführen oder die Cluster-Detailseite in der SageMaker-Konsole aufrufen. Die Konsole bietet auch eine Schaltfläche „Lifecycle-Skriptprotokolle anzeigen“, die direkt den entsprechenden CloudWatch-Protokollstream aufruft, was das Auffinden von Protokollen erleichtert. Darüber hinaus enthalten CloudWatch-Protokolle für Lifecycle-Skripts jetzt Markierungen, mit denen Sie den Fortschritt der Lifecycle-Skriptausführung verfolgen können. Unter anderem wird nachvollziehbar, wann das Lifecycle-Skriptprotokoll startet, wann Skripts heruntergeladen werden, wann Downloads abgeschlossen sind und wann Skripts erfolgreich ausgeführt wurden oder fehlschlagen. Anhand dieser Markierungen können Sie schnell erkennen, an welchem Punkt der Bereitstellung Probleme aufgetreten sind. Diese Verbesserungen reduzieren den Zeitaufwand für die Diagnose und Behebung von Lifecycle-Skriptfehlern und helfen Ihnen, Ihre HyperPod-Cluster schneller zum Laufen zu bringen.
Diese Funktion ist in allen AWS-Regionen verfügbar, in denen Amazon SageMaker HyperPod unterstützt wird. Weitere Informationen finden Sie unter Cluster-Management mit SageMaker HyperPod im Entwicklerhandbuch zu Amazon SageMaker.