Amazon SageMaker HyperPod รองรับอินเทอร์เฟซเครือข่ายแบบ EFA-Only แล้ว
ขณะนี้ Amazon SageMaker HyperPod รองรับอินเทอร์เฟซเครือข่ายแบบ EFA-only สำหรับกลุ่มอินสแตนซ์ของคลัสเตอร์ ช่วยให้คุณสามารถกำหนดค่าอุปกรณ์ Elastic Fabric Adapter (EFA) แบบเฉพาะได้โดยไม่ต้องใช้อะแดปเตอร์เครือข่ายแบบยืดหยุ่น (ENA) แบบดั้งเดิมสำหรับเครือข่าย IP Amazon SageMaker HyperPod เป็นโครงสร้างพื้นฐานที่สร้างขึ้นโดยเฉพาะสำหรับการพัฒนาโมเดล AI/ML ซึ่งมอบสภาพแวดล้อมที่มีความยืดหยุ่นและมีประสิทธิภาพสูง พร้อมความสามารถ Fault Tolerance ในตัวและการกู้คืนคลัสเตอร์แบบที่ทำให้เป็นระบบอัตโนมัติ ขณะนี้ด้วย EFA-Only จะทำให้คุณสามารถขยายขนาดคลัสเตอร์ AI/ML ได้มากยิ่งขึ้นโดยไม่เสี่ยงต่อการใช้ที่อยู่ IP จนหมดใน VPC ของคุณ
เมื่อเรียกใช้เวิร์กโหลดการฝึกแบบกระจายในระดับขนาดใหญ่ แบนด์วิดท์การสื่อสารระหว่างโหนดถือเป็นปัจจัยสำคัญต่อประสิทธิภาพของการฝึก อินสแตนซ์คลัสเตอร์ SageMaker HyperPod รองรับอินเทอร์เฟซเครือข่ายที่รองรับ EFA ได้หลายรายการ แต่การกำหนดค่าโดยใช้ประเภทอินเทอร์เฟซ efa มาตรฐานจะเชื่อมต่อทั้งอุปกรณ์ Elastic Fabric Adapter (EFA) และ อะแดปเตอร์เครือข่ายแบบยืดหยุ่น (ENA) (สำหรับระบบเครือข่าย IP) เข้ากับแต่ละอินเทอร์เฟซ แม้ว่าจะต้องใช้เครือข่าย IP กับเพียงบางส่วนของอินเทอร์เฟซภายในโหนดก็ตาม ประเภทอินเทอร์เฟซ EFA จะใช้ที่อยู่ IP ในซับเน็ตของคุณสำหรับอุปกรณ์ ENA แต่ละตัวที่เชื่อมต่ออยู่โดยหลีกเลี่ยงไม่ได้ ซึ่งอาจนำไปสู่การใช้ที่อยู่ IP จนหมด และจำกัดจำนวนโหนดที่คุณสามารถปรับใช้ภายในซับเน็ตเดียวได้ ด้วยการเปิดตัวครั้งนี้ ขณะนี้คุณสามารถกำหนดค่า efa-only ได้เมื่อกำหนดค่าอินเทอร์เฟซเครือข่ายสำหรับกลุ่มอินสแตนซ์คลัสเตอร์ HyperPod ของคุณ ตัวเลือกนี้จะจัดสรรอินเทอร์เฟซเครือข่ายสำหรับทราฟฟิก EFA โดยเฉพาะ โดยไม่เชื่อมต่ออุปกรณ์ ENA ซึ่งทำให้คุณสามารถเพิ่มจำนวนอินเทอร์เฟซ EFA จัดสรรไว้สำหรับการสื่อสารระหว่างโหนดที่มีเวลาแฝงและมีอัตราการโอนถ่ายข้อมูลสูงได้สูงสุด เนื่องจากอินเทอร์เฟซ EFA-Only ไม่จำเป็นต้องใช้ที่อยู่ IP คุณจึงสามารถปรับขนาดไปยังคลัสเตอร์ที่มีขนาดใหญ่ขึ้นภายในซับเน็ตเดิมได้ โดยไม่ประสบปัญหาการใช้ที่อยู่ IP จนหมด การกำหนดค่านี้มีประโยชน์อย่างยิ่งสำหรับงานการฝึกแบบกระจายในระดับขนาดใหญ่ที่แบนด์วิดท์การสื่อสารระหว่างโหนดเป็นปัจจัยสำคัญ และไม่จำเป็นต้องมีเครือข่าย IP แบบเฉพาะบนทุกอินเทอร์เฟซ
ในการเปิดใช้งาน EFA-Only ให้ระบุค่า efa-only ในการกำหนดค่า ClusterNetworkInterface เมื่อสร้างหรืออัปเดตคลัสเตอร์ HyperPod ของคุณผ่าน API ของ CreateCluster/UpdateCluster EFA-Only พร้อมใช้งานใน AWS Region ทุกแห่งที่ Amazon SageMaker HyperPod รองรับ หากต้องการเรียนรู้เพิ่มเติม โปรดดู ClusterNetworkInterface ในเอกสารอ้างอิง API ของ Amazon SageMaker