AWS Parallel Computing Service (PCS) unterstützt jetzt den Reboot von Knoten über Slurm

Veröffentlicht am: 2. Okt. 2025

AWS Parallel Computing Service (PCS) ermöglicht es Ihnen jetzt, Rechenknoten mit Slurm-Befehlen neu zu starten, ohne den Austausch von Instance auszulösen. Mit dieser Funktion können Sie die Knoten aus betrieblichen Gründen neu starten, z. B. zur Fehlerbehebung, zur Bereinigung von Ressourcen und zur Wiederherstellung von degradierten Zuständen, bevor ein vollständiger Austausch des Knotens erforderlich wird. So können Sie den Zustand des Clusters effizient und zu geringeren Kosten aufrechterhalten.

Diese Funktion ist in allen AWS-Regionen verfügbar, in denen PCS verfügbar ist. Sie können den Befehl „scontrol reboot“ mit Optionen zur Planung von sofortigen oder verzögerten Reboots verwenden, während Reboots über andere Methoden weiterhin die Ersetzung von Instances auslösen. Weitere Informationen finden Sie unter Rebooten von Rechenknoten mit Slurm in AWS PCS.

PCS ist ein verwalteter Service, der die Ausführung und Skalierung von High Performance Computing (HPC)-Workloads auf AWS mit Slurm vereinfacht. Weitere Informationen über PCS finden Sie in der Servicedokumentation.