SageMaker HyperPod รองรับการจัดสรรโควต้าแบบละเอียดของทรัพยากรการประมวลผลแล้ว

โพสต์บน: 14 ส.ค. 2025

การกำกับดูแล Task ของ SageMaker HyperPod ตอนนี้รองรับการจัดสรรโควต้าการประมวลผลแบบละเอียดของ GPU, ตัวเร่ง Trainium, vCPU และหน่วยความจำ vCPU ภายในอินสแตนซ์ ผู้ดูแลระบบสามารถจัดสรรโควต้าการประมวลผลแบบละเอียดข้ามทีมเพื่อปรับปรุงการกระจายทรัพยากรการประมวลผลให้เหมาะสม และให้เป็นไปตามงบประมาณที่กำหนด

นักวิทยาศาสตร์ข้อมูลมักจะเรียกใช้ งาน LLM เช่น การฝึกอบรมหรือการอนุมาน ซึ่งไม่จำเป็นต้องใช้อินสแตนซ์ HyperPod ทั้งหมด ซึ่งนำไปสู่การใช้งานทรัพยากรการประมวลผลที่ได้รับการเร่งความเร็วต่ำกว่าที่ควรจะเป็น การกำกับดูแล Task ของ HyperPod ช่วยให้ผู้ดูแลระบบสามารถจัดการการจัดสรรโควต้าการประมวลผลข้ามทีมต่าง ๆ ได้ ด้วยความสามารถนี้ ผู้ดูแลระบบสามารถจัดสรรทรัพยากรการประมวลผลอย่างมีกลยุทธ์เพื่อให้มั่นใจว่าสามารถเข้าถึงได้อย่างยุติธรรม ป้องกันการผูกขาดทรัพยากร และเพิ่มการใช้ประโยชน์คลัสเตอร์ให้สูงสุด ความสามารถนี้ช่วยให้สามารถจัดสรรโควต้าการประมวลผลแบบละเอียดได้ นอกเหนือจากการจัดสรรระดับอินสแตนซ์ ซึ่งสอดคล้องกับความต้องการของเวิร์กโหลดขององค์กร

การกำกับดูแล Task ของ SageMaker HyperPod พร้อมให้ใช้งานแล้วใน AWS Region ทุกแห่งที่ให้บริการ HyperPod ได้แก่ สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), เอเชียแปซิฟิก (มุมไบ), เอเชียแปซิฟิก (สิงคโปร์), เอเชียแปซิฟิก (ซิดนีย์) และเอเชียแปซิฟิก (โตเกียว), ยุโรป (แฟรงก์เฟิร์ต) ยุโรป (ไอร์แลนด์), ยุโรป (ลอนดอน), ยุโรป (สตอกโฮล์ม) และอเมริกาใต้ (เซาเปาลู)

หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้าเว็บ SageMaker HyperPod และเอกสารประกอบการกำกับดูแล Task ของ HyperPod