การกำกับดูแลงานมีให้บริการโดยทั่วไปสำหรับ Amazon SageMaker HyperPod แล้ว

โพสต์บน: 4 ธ.ค. 2024

Amazon SageMaker HyperPod มอบการกำกับดูแลแบบรวมศูนย์สำหรับงานด้านการพัฒนา AI ช่วยสร้างทั้งหมดแล้ว เช่น การฝึกอบรมและการอนุมาน คุณสามารถมองเห็นและควบคุมการจัดสรรทรัพยากรการคำนวณได้อย่างเต็มที่ เพื่อให้แน่ใจว่าจัดลำดับความสำคัญให้กับงานที่สำคัญที่สุดและเพิ่มการใช้ทรัพยากรการประมวลผลให้ได้มากที่สุด ทำให้ลดต้นทุนการพัฒนาโมเดลได้มากถึง 40%

การกำกับดูแลงาน HyperPod ทำให้ผู้ดูแลระบบสามารถกำหนดลำดับความสำคัญสำหรับงานต่าง ๆ ได้ง่ายขึ้น และกำหนดขีดจำกัดสำหรับจำนวนทรัพยากรการคำนวณที่แต่ละทีมสามารถใช้ได้ ผู้ดูแลระบบยังสามารถติดตามและตรวจสอบงานที่กำลังใช้หรือรอทรัพยากรการคำนวณผ่านแดชบอร์ดภาพได้ตลอดเวลา เมื่อนักวิทยาศาสตร์ข้อมูลสร้างงานของพวกเขา HyperPod จะเรียกใช้งานเหล่านั้นโดยอัตโนมัติ โดยปฏิบัติตามขีดจำกัดของทรัพยากรการคำนวณและลำดับความสำคัญที่กำหนดไว้ ตัวอย่างเช่น เมื่อจำเป็นต้องฝึกอบรมโมเดลที่มีความสำคัญสูงสุดอย่างเร็วที่สุด แต่ทรัพยากรการคำนวณทั้งหมดกำลังใช้งานอยู่ HyperPod จะลดทรัพยากรจากงานที่มีความสำคัญต่ำกว่าเพื่อสนับสนุนการฝึกอบรม HyperPod จะหยุดงานที่มีลำดับความสำคัญต่ำชั่วคราว บันทึกจุดตรวจ และจัดสรรทรัพยากรการคำนวณที่ลดลง งานที่มีความสำคัญต่ำที่กำหนดไว้ล่วงหน้าจะดำเนินการต่อจากจุดตรวจสอบที่บันทึกไว้ครั้งสุดท้าย เมื่อทรัพยากรพร้อมให้บริการอีกครั้ง และเมื่อทีมไม่ได้ใช้ขีดจำกัดทรัพยากรที่ผู้ดูแลระบบตั้งไว้อย่างเต็มที่ HyperPod จะใช้ทรัพยากรที่ไม่ใช้งานเหล่านั้นเพื่อเร่งงานของทีมอื่น นอกจากนี้ HyperPod ยังผสานการทำงานกับสตูดิโอของ Amazon SageMaker ซึ่งนำการกำกับดูแลงานและความสามารถอื่น ๆ ของ HyperPod มาที่สภาพแวดล้อมของสตูดิโอ นักวิทยาศาสตร์ข้อมูลสามารถโต้ตอบกับคลัสเตอร์ของ HyperPod ได้อย่างราบรื่นโดยตรงจากสตูดิโอ ทำให้พวกเขาสามารถพัฒนา ส่ง และตรวจสอบงานของแมชชีนเลิร์นนิง (ML) บนคลัสเตอร์ที่รองรับตัวเร่งประสิทธิภาพสูงได้

การกำกับดูแลงานสำหรับ HyperPod มีให้บริการในทุก AWS Region ที่มีบริการ HyperPod ได้แก่ สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (แคลิฟอร์เนียเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), เอเชียแปซิฟิก (มุมไบ), เอเชียแปซิฟิก (สิงคโปร์), เอเชียแปซิฟิก (ซิดนีย์) และเอเชียแปซิฟิก (โตเกียว), ยุโรป (แฟรงก์เฟิร์ต) ยุโรป (ไอร์แลนด์), ยุโรป (ลอนดอน), ยุโรป (สตอกโฮล์ม) และอเมริกาใต้ (เซาเปาลู)

ไปที่หน้าเว็บ SageMaker HyperPod บล็อกข่าว AWS และเอกสารประกอบของ SageMaker AI