Amazon SageMaker HyperPod แนะนำการแก้จุดบกพร่องของสคริปต์วงจรชีวิตที่ปรับปรุงใหม่
ตอนนี้ Amazon SageMaker HyperPod มอบความสามารถในการแก้ไขปัญหาสคริปต์วงจรชีวิตที่ได้รับการปรับปรุง ทำให้สามารถระบุและแก้ไขปัญหาในระหว่างการจัดเตรียมโหนดคลัสเตอร์ได้ง่ายขึ้น SageMaker HyperPod ช่วยให้คุณจัดสรรคลัสเตอร์ที่ยืดหยุ่นสำหรับเวิร์กโหลดของ AI/ML และพัฒนาโมเดลที่ทันสมัย เช่น โมเดลภาษาขนาดใหญ่ (LLM), โมเดลการแพร่กระจาย และโมเดลพื้นฐาน (FM)
เมื่อสคริปต์วงจรชีวิตพบปัญหาระหว่างการสร้างคลัสเตอร์หรือการดำเนินการกับโหนด ตอนนี้คุณจะได้รับข้อความแสดงข้อผิดพลาดโดยละเอียดซึ่งมีกลุ่มข้อมูลบันทึก CloudWatch เฉพาะและชื่อสตรีมข้อมูลบันทึก ซึ่งคุณสามารถค้นหาบันทึกการดำเนินการสำหรับสคริปต์วงจรชีวิตได้ คุณสามารถดูข้อความแสดงข้อผิดพลาดเหล่านี้ได้โดยเรียกใช้ DescribeCluster API หรือโดยดูหน้ารายละเอียดคลัสเตอร์ในคอนโซล SageMaker คอนโซลยังมีปุ่ม “ดูบันทึกสคริปต์วงจรชีวิต” ที่นำทางไปยังสตรีมข้อมูลบันทึก CloudWatch ที่เกี่ยวข้องโดยตรงทำให้ค้นหาบันทึกได้ง่ายขึ้น นอกจากนี้ บันทึกของ CloudWatch สำหรับสคริปต์วงจรชีวิตยังมีเครื่องหมายเฉพาะเพื่อช่วยคุณติดตามความคืบหน้าในการดำเนินการสคริปต์วงจรชีวิต รวมถึงตัวบ่งชี้สำหรับเวลาที่บันทึกสคริปต์วงจรชีวิตเริ่มต้น เมื่อมีการดาวน์โหลดสคริปต์ เมื่อดาวน์โหลดเสร็จสมบูรณ์ และเมื่อสคริปต์ประสบความสำเร็จหรือเกิดความล้มเหลว เครื่องหมายเหล่านี้ช่วยให้คุณระบุปัญหาที่เกิดขึ้นในระหว่างกระบวนการจัดเตรียมอย่างรวดเร็ว การปรับปรุงเหล่านี้ช่วยลดเวลาที่จำเป็นในการวินิจฉัยและแก้ไขความล้มเหลวของสคริปต์วงจรชีวิต ช่วยให้คุณทำงานในคลัสเตอร์ HyperPod ของคุณได้เร็วขึ้น
ฟีเจอร์นี้พร้อมใช้งานใน AWS Region ทุกแห่งที่รองรับ Amazon SageMaker HyperPod หากต้องการเรียนรู้เพิ่มเติม โปรดดูการจัดการคลัสเตอร์ SageMaker HyperPod ในคู่มือนักพัฒนา Amazon SageMaker