Amazon SageMaker HyperPod hiện hỗ trợ quản lý cấu trúc liên kết Slurm tự động

Ngày đăng: 23 Th04 2026

Amazon SageMaker HyperPod giờ đây tự động chọn và liên tục duy trì cấu hình cấu trúc liên kết mạng tối ưu cho các cụm Slurm dựa trên các loại phiên bản GPU trong cụm. Cấu trúc liên kết mạng tác động trực tiếp đến hiệu năng đào tạo phân tán. Khi công việc được đặt trên các nút có cấu trúc liên kết gần nhau, giao tiếp giữa các GPU sẽ nhanh hơn, hoạt động chung của NCCL hiệu quả hơn và thông lượng đào tạo được cải thiện. HyperPod điều chỉnh cấu trúc liên kết một cách linh hoạt khi cụm phát triển thông qua các hoạt động điều chỉnh quy mô và thay thế nút. Do đó, vị trí công việc vẫn được tối ưu hóa trong suốt vòng đời cụm mà không yêu cầu cập nhật thủ công cho các tệp cấu trúc liên kết hoặc cấu hình lại Slurm.

HyperPod kiểm tra các loại phiên bản trên tất cả các nhóm phiên bản khi tạo cụm, xác định các đặc điểm kết nối mạng và liên kết của từng loại phiên bản, đồng thời tự động chọn mô hình cấu trúc liên kết phù hợp nhất. HyperPod hỗ trợ cấu trúc liên kết dạng cây cho các loại phiên bản có liên kết phân cấp như ml.p5.48xlarge, ml.p5e.48xlarge và ml.p5en.48xlarge, và cấu trúc liên kết dạng khối cho các loại phiên bản có khả năng kết nối băng thông cao đồng nhất như ml.p6e-gb200.NVL72. Đối với các cụm có loại phiên bản hỗn hợp, HyperPod sẽ chọn cấu trúc liên kết tương thích hoạt động trên tất cả các nút. Khi cụm thay đổi thông qua các sự kiện tăng quy mô, giảm quy mô hoặc thay thế nút, HyperPod sẽ tự động cập nhật cấu hình cấu trúc liên kết mà không cần can thiệp thủ công. Do đó, cấu trúc liên kết luôn phản ánh trạng thái thực tế của cụm.

Để bắt đầu, hãy tạo cụm SageMaker HyperPod Slurm với các loại phiên bản GPU được hỗ trợ. Lập lịch có lưu ý cấu trúc liên kết được bật theo mặc định và không yêu cầu cấu hình.

Tính năng này được cung cấp ở tất cả các Khu vực AWS có hỗ trợ Amazon SageMaker HyperPod. Để tìm hiểu thêm về lập lịch có lưu ý cấu trúc liên kết, hãy truy cập tài liệu về Amazon SageMaker HyperPod.