Amazon SageMaker HyperPod kini mendukung antarmuka jaringan hanya EFA
Amazon SageMaker HyperPod kini mendukung antarmuka jaringan hanya EFA untuk grup instans klaster, memungkinkan Anda untuk mengkonfigurasi perangkat Elastic Fabric Adapter (EFA) khusus tanpa Adaptor Jaringan Elastis (ENA) tradisional untuk jaringan IP. SageMaker HyperPod adalah infrastruktur yang dirancang khusus untuk pengembangan model AI/ML yang menyediakan lingkungan yang tangguh dan berkinerja tinggi dengan toleransi kesalahan bawaan dan pemulihan klaster otomatis. Sekarang dengan hanya EFA, Anda dapat meningkatkan skala klaster AI/ML lebih jauh tanpa risiko kehabisan alamat IP di VPC Anda.
Saat menjalankan beban kerja pelatihan terdistribusi skala besar, bandwidth komunikasi antar simpul sangat penting untuk kinerja pelatihan. Instans klaster SageMaker HyperPod mendukung beberapa antarmuka jaringan yang kompatibel dengan EFA, tetapi mengkonfigurasinya dengan tipe antarmuka efa standar akan memasang perangkat EFA dan perangkat ENA (untuk jaringan IP) ke setiap antarmuka — bahkan ketika jaringan IP hanya dibutuhkan pada sebagian antarmuka dalam sebuah simpul. Tipe antarmuka efa pasti akan menggunakan alamat IP di subnet Anda untuk setiap perangkat ENA yang terhubung, yang dapat menyebabkan kehabisan alamat IP dan membatasi jumlah simpul yang dapat Anda sebarkan dalam satu subnet. Dengan peluncuran ini, Anda sekarang dapat mengatur hanya efa saat mengkonfigurasi antarmuka jaringan untuk grup instans klaster HyperPod Anda. Opsi ini mengalokasikan antarmuka jaringan secara eksklusif untuk lalu lintas EFA tanpa memasang perangkat ENA, memungkinkan Anda untuk memaksimalkan jumlah antarmuka EFA yang didedikasikan untuk komunikasi antar-simpul dengan latensi rendah dan throughput tinggi. Karena antarmuka hanya EFA tidak memerlukan alamat IP, Anda dapat meningkatkan skala ke klaster yang lebih besar dalam subnet yang sama tanpa mengalami kehabisan IP. Konfigurasi ini sangat bermanfaat untuk tugas pelatihan terdistribusi skala besar di mana bandwidth komunikasi antar simpul sangat penting dan jaringan IP khusus pada setiap antarmuka tidak diperlukan.
Untuk mengaktifkan hanya EFA, tentukan hanya efa dalam konfigurasi ClusterNetworkInterface saat membuat atau memperbarui klaster HyperPod Anda melalui API CreateCluster/UpdateCluster. Hanya EFA tersedia di semua AWS Region yang mendukung Amazon SageMaker HyperPod. Untuk mempelajari lebih lanjut, lihat ClusterNetworkInterface di Referensi API Amazon SageMaker.