Amazon SageMaker HyperPod รองรับกลุ่มอินสแตนซ์แบบยืดหยุ่นแล้ว
Amazon SageMaker HyperPod รองรับกลุ่มอินสแตนซ์แบบยืดหยุ่น ซึ่งช่วยให้ลูกค้าสามารถระบุประเภทอินสแตนซ์หลายประเภทและซับเน็ตหลายรายการภายในกลุ่มอินสแตนซ์เดียว ลูกค้าที่ใช้เวิร์กโหลดการฝึกและการอนุมานบน HyperPod มักต้องใช้หลายประเภทอินสแตนซ์และหลาย Availability Zone เพื่อความยืดหยุ่นด้านปริมาณการประมวลผล การปรับค่าใช้จ่ายให้เหมาะสม และการใช้ซับเน็ต แต่ก่อนหน้านี้จำเป็นต้องสร้างและจัดการกลุ่มอินสแตนซ์แยกสำหรับทุกการรวมกันของประเภทอินสแตนซ์และ Availability Zone ซึ่งส่งผลให้เกิดภาระในการดำเนินงานด้านการกำหนดค่าคลัสเตอร์ การปรับขนาด การแพตช์ และการติดตามตรวจสอบ
ด้วยกลุ่มอินสแตนซ์แบบยืดหยุ่น คุณสามารถกำหนดรายการประเภทอินสแตนซ์ตามลำดับความสำคัญโดยใช้พารามิเตอร์ InstanceRequirements ใหม่ และระบุซับเน็ตหลายรายการข้าม Availability Zone ภายในกลุ่มอินสแตนซ์เดียว HyperPod จะจัดเตรียมอินสแตนซ์โดยใช้ประเภทที่มีลำดับความสำคัญสูงสุดก่อน และจะสลับไปใช้ประเภทที่มีลำดับความสำคัญต่ำกว่าทันทีเมื่อไม่มีปริมาณการประมวลผลเพียงพอ ช่วยลดความจำเป็นที่ลูกค้าต้องลองใหม่ด้วยตนเองในแต่ละกลุ่มอินสแตนซ์ ลูกค้าที่ทำการฝึกจะได้รับประโยชน์จากการกระจายซับเน็ตหลายรายการภายใน Availability Zone เพื่อหลีกเลี่ยงการใช้ซับเน็ตจนหมด ลูกค้าที่ทำการอนุมานและปรับขนาดแบบแมนนวลจะได้รับการสลับไปใช้ประเภทอินสแตนซ์ตามลำดับความสำคัญโดยอัตโนมัติ โดยไม่ต้องลองใหม่ในแต่ละกลุ่มอินสแตนซ์ ขณะที่ผู้ที่ใช้การปรับขนาดอัตโนมัติด้วย Karpenter สามารถอ้างอิงกลุ่มอินสแตนซ์แบบยืดหยุ่นเพียงกลุ่มเดียวได้ Karpenter จะตรวจจับประเภทอินสแตนซ์ที่รองรับจากกลุ่มอินสแตนซ์แบบยืดหยุ่นโดยอัตโนมัติ และจัดเตรียมประเภทและ Availability Zone ที่เหมาะสมที่สุดตามความต้องการของพ็อด คุณสามารถสร้างกลุ่มอินสแตนซ์แบบยืดหยุ่นได้โดยใช้ API CreateCluster และ UpdateCluster, AWS CLI หรือคอนโซลการจัดการของ AWS
กลุ่มอินสแตนซ์แบบยืดหยุ่นพร้อมใช้งานสำหรับคลัสเตอร์ SageMaker HyperPod ที่ใช้เครื่องมือควบคุมระบบ EKS ใน AWS Region ทุกแห่งที่รองรับ SageMaker HyperPod หากต้องการเรียนรู้เพิ่มเติม โปรดดูกลุ่มอินสแตนซ์แบบยืดหยุ่น