Amazon SageMaker HyperPod hiện hỗ trợ giao diện mạng chỉ sử dụng EFA

Ngày đăng: 1 Th06 2026

Amazon SageMaker HyperPod hiện hỗ trợ giao diện mạng chỉ sử dụng EFA đối với các nhóm phiên bản cụm, cho phép bạn cấu hình các thiết bị chuyên dụng của Trình chuyển cấu trúc linh hoạt (EFA) mà không cần Trình chuyển mạng linh hoạt (ENA) truyền thống để kết nối mạng IP. SageMaker HyperPod là cơ sở hạ tầng chuyên dụng để phát triển mô hình AI/ML, cung cấp một môi trường có khả năng phục hồi, hiệu năng cao, được tích hợp khả năng chịu lỗi và có thể khôi phục cụm tự động. Giờ đây, với tính năng chỉ sử dụng EFA, bạn có thể mở rộng các cụm AI/ML hơn nữa mà không gặp rủi ro cạn kiệt địa chỉ IP trong VPC của mình.

Khi chạy khối lượng công việc đào tạo phân tán quy mô lớn, băng thông giao tiếp giữa các nút là rất quan trọng đối với hiệu năng đào tạo. Các phiên bản cụm SageMaker HyperPod hỗ trợ nhiều giao diện mạng có khả năng EFA. Tuy nhiên, nếu cấu hình các phiên bản này bằng loại giao diện EFA tiêu chuẩn, mỗi giao diện sẽ được gắn cả thiết bị EFA và thiết bị ENA (để kết nối mạng IP), ngay cả khi chỉ cần kết nối mạng IP trên một tập hợp con giao diện trong một nút. Loại giao diện EFA sẽ bắt buộc sử dụng địa chỉ IP trong mạng con của bạn cho mỗi thiết bị ENA được gắn vào, điều này có thể làm cạn kiệt địa chỉ IP và giới hạn số lượng nút bạn có thể triển khai trong một mạng con duy nhất. Với lần ra mắt này, giờ đây bạn có thể thiết lập giá trị efa-only khi cấu hình giao diện mạng cho các nhóm phiên bản cụm HyperPod. Tùy chọn này phân bổ giao diện mạng dành riêng cho lưu lượng EFA mà không cần gắn thiết bị ENA, cho phép bạn tối đa hóa số lượng giao diện EFA dành riêng cho giao tiếp giữa các nút có độ trễ thấp, thông lượng cao. Bởi vì các giao diện chỉ sử dụng EFA không yêu cầu địa chỉ IP, bạn có thể mở rộng quy mô thành các cụm lớn hơn trong cùng một mạng con mà không gặp phải tình trạng cạn kiệt IP. Cấu hình này đặc biệt có lợi cho các công việc đào tạo phân tán quy mô lớn, trong đó băng thông giao tiếp giữa các nút là quan trọng và không cần kết nối mạng IP chuyên dụng trên mọi giao diện.

Để bật tính năng chỉ sử dụng EFA, hãy chỉ định giá trị efa-only trong cấu hình ClusterNetworkInterface khi tạo hoặc cập nhật cụm HyperPod thông qua API CreateCluster/UpdateCluster. Tính năng này được cung cấp ở tất cả các Khu vực AWS có hỗ trợ Amazon SageMaker HyperPod. Để tìm hiểu thêm, hãy xem ClusterNetworkInterface trong Tham chiếu API Amazon SageMaker.