AWS Parallel Computing Service kini mendukung Slurm 25.11

Dikirim di: 23 Apr 2026

Layanan Komputasi Paralel AWS (AWS PCS) kini mendukung Slurm versi 25.11, dengan dukungan untuk titik akhir OpenMetrics yang kompatibel dengan Prometheus, dan memperkenalkan tipe log baru termasuk log audit penjadwal.

Rilis Slurm 25.11 ini memperkenalkan antrean ulang yang dipercepat, yang dapat secara otomatis menjadwalkan ulang pekerjaan yang terpengaruh oleh masalah simpul pada prioritas tertinggi untuk membantu beban kerja Anda pulih lebih cepat. Anda dapat mengaktifkan titik akhir OpenMetrics baru untuk visibilitas real-time ke dalam pekerjaan, simpul, dan penjadwalan menggunakan tool pemantauan yang sudah ada. AWS PCS kini juga dapat mengirim log daemon basis data Slurm (slurmdbd) dan daemon API REST (slurmrestd) ke Log Amazon CloudWatch, Amazon S3, atau Amazon Data Firehose, yang membantu mendiagnosis masalah akuntansi dan men-debug integrasi API. Log audit penjadwal, yang sebelumnya termasuk dalam log operasional, kini disajikan sebagai tipe log khusus, memberikan kontrol independen atas biaya penyerapan dan penyimpanan.

AWS PCS adalah layanan terkelola yang memudahkan Anda menjalankan dan meningkatkan skala beban kerja komputasi performa tinggi (HPC) serta membangun model ilmiah dan teknik di AWS menggunakan Slurm. Anda dapat menggunakan AWS PCS untuk membangun lingkungan yang lengkap dan elastis yang mengintegrasikan alat komputasi, penyimpanan, jaringan, dan visualisasi. AWS PCS menyederhanakan operasi klaster dengan pembaruan terkelola dan fitur observabilitas bawaan, yang membantu menghapus beban pemeliharaan. Anda dapat bekerja di lingkungan familier, yang berfokus pada penelitian dan inovasi Anda, alih-alih mengkhawatirkan infrastruktur.

Fitur ini tersedia di semua AWS Region tempat AWS PCS tersedia. Biaya standar berlaku untuk tujuan pengiriman log. Untuk mempelajari lebih lanjut tentang AWS PCS, lihat dokumentasi layanan.