SageMaker HyperPod คืออะไร
Amazon SageMaker HyperPod ขจัดภาระงานหนักที่ไม่มีความแตกต่างซึ่งเกี่ยวข้องในการสร้างโมเดล AI ช่วยสร้าง ช่วยปรับขนาดงานการพัฒนาโมเดลอย่างรวดเร็ว เช่น การฝึก การปรับแต่ง หรือการอนุมานในคลัสเตอร์ตัวเร่งความเร็ว AI หลายร้อยหรือหลายพันตัว SageMaker HyperPod ช่วยให้สามารถบริหารจัดการแบบรวมศูนย์สำหรับงานพัฒนาโมเดลทั้งหมดของคุณ ทำให้คุณมองเห็นและควบคุมได้อย่างเต็มที่ว่างานต่าง ๆ จะได้รับความสำคัญอย่างไร รวมไปถึงทรัพยากรการประมวลผลจะได้รับการจัดสรรให้กับแต่ละงานอย่างไร ช่วยให้คุณใช้ GPU และ AWS Trainium ของคลัสเตอร์ของคุณได้สูงสุด และเร่งนวัตกรรมได้
ด้วย SageMaker HyperPod คุณสามารถกระจายและจัดเวิร์กโหลดการฝึกของคุณให้ครอบคลุมตัวเร่งความเร็วทั้งหมดได้อย่างมีประสิทธิภาพ SageMaker HyperPod จะใช้การกำหนดค่าการฝึกที่ดีที่สุดโดยอัตโนมัติสำหรับรุ่นยอดนิยมที่มีเผยแพร่สู่สาธารณะ เพื่อช่วยให้คุณบรรลุประสิทธิภาพที่เหมาะสมที่สุดได้อย่างรวดเร็ว นอกจากนี้ ยังติดตามตรวจสอบคลัสเตอร์ของคุณอย่างต่อเนื่องเพื่อดูข้อผิดพลาดของโครงสร้างพื้นฐาน ซ่อมแซมปัญหาโดยอัตโนมัติ และกู้คืนเวิร์กโหลดของคุณโดยไม่ต้องมีการแทรกแซงจากมนุษย์ ทั้งหมดนี้ช่วยให้คุณประหยัดเวลาในการฝึกได้ถึง 40%
ประโยชน์ของ SageMaker HyperPod
แนะนำการกำกับดูแลงานใน SageMaker HyperPod
เพิ่มการใช้ประโยชน์สูงสุดและให้มองเห็นทรัพยากรการประมวลผลได้ครบถ้วน ขณะเดียวกันก็ลดต้นทุนได้ด้วย