ตอนนี้ AWS Parallel Computing Service รองรับ Slurm 25.11 แล้ว

โพสต์บน: 23 เม.ย. 2026

ขณะนี้ AWS Parallel Computing Service (AWS PCS) รองรับ Slurm เวอร์ชัน 25.11 พร้อมการรองรับตำแหน่งข้อมูล OpenMetrics ที่เข้ากันได้กับ Prometheus และเพิ่มประเภทข้อมูลบันทึกใหม่ รวมถึงข้อมูลบันทึกการตรวจประเมินของตัวกำหนดเวลา

การออกรุ่น Slurm 25.11 นี้เพิ่มความสามารถการจัดคิวใหม่แบบเร่งด่วน ซึ่งสามารถจัดคิวงานใหม่โดยอัตโนมัติสำหรับงานที่ได้รับผลกระทบจากปัญหาโหนดโดยให้ความสำคัญสูงสุด เพื่อช่วยให้เวิร์กโหลดของคุณฟื้นตัวได้เร็วขึ้น คุณสามารถเปิดใช้งานตำแหน่งข้อมูล OpenMetrics ใหม่เพื่อให้มองเห็นข้อมูลแบบเรียลไทม์เกี่ยวกับงาน โหนด และการจัดตารางเวลา โดยใช้เครื่องมือการติดตามตรวจสอบที่คุณมีอยู่ ขณะนี้ AWS PCS ยังสามารถส่งข้อมูลบันทึกของ Slurm Database Daemon (slurmdbd) และ REST API Daemon (slurmrestd) ไปยัง Amazon CloudWatch Logs, Amazon S3 หรือ Amazon Data Firehose เพื่อช่วยวิเคราะห์ปัญหาด้านการบัญชีและการแก้ไขข้อบกพร่องของการผสานรวม API ข้อมูลบันทึกการตรวจประเมินของตัวกำหนดเวลา ซึ่งก่อนหน้านี้รวมอยู่ในข้อมูลบันทึกการดำเนินงาน ขณะนี้ถูกจัดส่งเป็นประเภทข้อมูลบันทึกเฉพาะ ทำให้สามารถควบคุมการนำเข้าและค่าใช้จ่ายในการจัดเก็บได้อย่างอิสระ

AWS PCS เป็นบริการที่มีการจัดการที่ทำให้คุณสามารถเรียกใช้และปรับขนาดเวิร์กโหลดการประมวลผลประสิทธิภาพสูง (HPC) ได้ง่ายขึ้นและสร้างโมเดลทางวิทยาศาสตร์และวิศวกรรมบน AWS โดยใช้ Slurm คุณสามารถใช้ AWS PCS เพื่อสร้างสภาพแวดล้อมที่สมบูรณ์และยืดหยุ่นซึ่งผนวกรวมเครื่องมือประมวลผล พื้นที่จัดเก็บ เครือข่าย และการสร้างภาพเข้าด้วยกัน AWS PCS ช่วยลดความยุ่งยากในการดำเนินงานคลัสเตอร์ด้วยการอัปเดตที่มีการจัดการและฟีเจอร์การสังเกตในตัว ช่วยขจัดภาระการบำรุงรักษา คุณสามารถทำงานในสภาพแวดล้อมที่คุ้นเคย โดยมุ่งเน้นไปที่การวิจัยและนวัตกรรมของคุณแทนที่จะกังวลเกี่ยวกับโครงสร้างพื้นฐาน

ฟีเจอร์เหล่านี้พร้อมใช้งานใน AWS Region ทุกแห่งที่มี AWS PCS ให้บริการ มีค่าใช้จ่ายตามปกติสำหรับปลายทางการจัดส่งข้อมูลบันทึก หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ AWS PCS โปรดดูเอกสารประกอบสำหรับบริการ