AWS Parallel Computing Service (PCS) kini mendukung reboot simpul melalui Slurm

Dikirim di: 2 Okt 2025

AWS Parallel Computing Service (PCS) kini memungkinkan Anda untuk me-reboot simpul komputasi menggunakan perintah Slurm tanpa memicu penggantian instans. Dengan fitur ini, Anda dapat mem-boot ulang simpul untuk alasan operasional seperti pemecahan masalah, pembersihan sumber daya, dan pemulihan dari kondisi yang menurun sebelum memerlukan penggantian simpul penuh, sehingga memungkinkan Anda menjaga kesehatan klaster secara efisien dengan biaya yang lebih rendah.

Fitur ini tersedia di semua AWS Region tempat PCS tersedia. Anda dapat menggunakan perintah 'scontrol reboot' dengan opsi untuk menjadwalkan reboot langsung atau tertunda, sementara reboot melalui metode lain akan terus memicu penggantian instans. Untuk mempelajari lebih lanjut, lihat Mem-boot ulang simpul komputasi dengan Slurm di AWS PCS.

PCS adalah layanan terkelola yang menyederhanakan menjalankan dan menskalakan beban kerja komputasi performa tinggi (HPC) di AWS menggunakan Slurm. Untuk mempelajari selengkapnya tentang PCS, lihat dokumentasi layanan.