Amazon SageMaker HyperPod unterstützt jetzt Knotenaktionen von der Konsole aus

Veröffentlicht am: 10. Feb. 2026

Amazon SageMaker HyperPod ermöglicht es Ihnen jetzt, einzelne Cluster-Knoten direkt aus der AWS-Konsole zu verwalten. HyperPod-Cluster-Betreiber, die umfangreiche KI/ML-Workloads verwalten, müssen häufig eine Verbindung zu Knoten herstellen, um Fehler zu beheben, nicht reagierende Instances neu zu starten oder heruntergestufte Knoten zu ersetzen. Für die Verbindung zu einem Knoten mussten zuvor SSM-Verbindungszeichenfolgen manuell erstellt werden, während die Knoten-Wiederherstellungsaktionen wie Neustart und Ersetzen CLI-Befehle erforderten – jetzt bietet die Konsole eine einzige Schnittstelle für alle Knotenaktionen.

Mit Knotenaktionen in der Konsole können Sie jetzt über den AWS Systems Manager (SSM) eine Verbindung zu jedem Knoten herstellen. Die Konsole bietet vorab ausgefüllte SSM-CLI-Befehle mit Unterstützung für das Kopieren in die Zwischenablage und direkten SSM-Session-Launch in der Konsole. SageMaker HyperPod-Cluster unterstützen zwar bereits das automatische Ersetzen und Neustarten fehlerhafter Instances, aber es gibt Szenarien wie Speicherüberläufe oder eine nicht feststellbare Hardwareverschlechterung, die möglicherweise ein manuelles Eingreifen erfordern. Knotenaktionen in der Konsole bieten jetzt einen konsistenten Ansatz zum manuellen Neustarten von Knoten, um vorübergehende Probleme zu beheben, fehlerhafte Knoten zu löschen und Knoten zu ersetzen. Batch-Operationen unterstützen mehrere Knotenaktionen gleichzeitig, sodass Sie Knotenprobleme innerhalb von Minuten lösen können. Diese Funktion ist besonders nützlich, wenn zeitkritische KI-Trainings- und Inferenz-Workloads ausgeführt werden, bei denen die Minimierung von Ausfallzeiten unerlässlich ist.

Diese Funktion ist in allen AWS-Regionen verfügbar, in denen Amazon SageMaker HyperPod unterstützt wird. Sie können all diese Knotenaktionen auf der HyperPod Cluster-Verwaltungsseite der Konsole ausführen. Klicken Sie auf die entsprechenden Links, um mehr über das Ersetzen/Neustarten und das Herstellen einer Verbindung zu einem Knoten zu erfahren.