ตอนนี้ AWS Parallel Computing Service (PCS) รองรับการรีบูตโหนดผ่าน Slurm

โพสต์บน: 2 ต.ค. 2025

ตอนนี้ AWS Parallel Computing Service (PCS) ช่วยให้คุณสามารถรีบูตโหนดการประมวลโดยใช้คำสั่ง Slurm โดยไม่ต้องกระตุ้นการเปลี่ยนอินสแตนซ์ ด้วยฟีเจอร์นี้ คุณสามารถรีบูตโหนดเพื่อเหตุผลในการดำเนินงานได้ เช่น การแก้ไขปัญหา การทำความสะอาดทรัพยากร และการกู้คืนจากสถานะที่เสื่อมสภาพก่อนที่จะต้องเปลี่ยนโหนดเต็มรูปแบบ ทำให้คุณสามารถรักษาสถานะประสิทธิภาพของคลัสเตอร์ได้อย่างมีประสิทธิภาพด้วยต้นทุนที่ต่ำลง

ฟีเจอร์นี้พร้อมใช้งานใน AWS Region ทุกแห่งที่ให้บริการ PCS. คุณสามารถใช้คำสั่ง 'scontrol reboot' พร้อมตัวเลือกในการกำหนดเวลาการรีบูตทันทีหรือเลื่อนออกไป ขณะที่การรีบูตผ่านวิธีการอื่นจะยังคงกระตุ้นการเปลี่ยนอินสแตนซ์ต่อไป หากต้องการเรียนรู้เพิ่มเติม โปรดดูที่การรีบูตโหนดประมวลด้วย Slurm ใน AWS PCS

PCS เป็นบริการที่มีการจัดการที่ช่วยลดความยุ่งยากในการทำงาน และการปรับขนาดเวิร์กโหลดการประมวลผลประสิทธิภาพสูง (HPC) บน AWS โดยใช้ Slurm หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ PCS โปรดดูเอกสารประกอบบริการ