SageMaker HyperPod hiện hỗ trợ khả năng phân bổ hạn mức tài nguyên điện toán chi tiết
Quản trị nhiệm vụ SageMaker HyperPod hiện hỗ trợ phân bổ hạn mức điện toán chi tiết cho GPU, trình tăng tốc Trainium, vCPU và bộ nhớ vCPU trong một phiên bản. Quản trị viên có thể phân bổ hạn mức điện toán chi tiết giữa các nhóm, tối ưu hóa phân phối tài nguyên điện toán và đảm bảo không vượt quá ngân sách.
Các nhà khoa học dữ liệu thường thực hiện các tác vụ LLM, như đào tạo hoặc suy luận, vốn không cần đến toàn bộ phiên bản HyperPod, dẫn đến không sử dụng hết các tài nguyên điện toán tăng tốc. Quản trị nhiệm vụ HyperPod cho phép quản trị viên quản lý phân bổ hạn mức điện toán giữa các nhóm. Với khả năng này, quản trị viên giờ đây có thể phân bổ tài nguyên điện toán theo chiến lược, đảm bảo quyền truy cập công bằng, ngăn chặn độc quyền tài nguyên và tối đa hóa mức sử dụng cụm. Khả năng này cho phép phân bổ hạn mức điện toán chi tiết bên cạnh phân bổ cấp phiên bản, phù hợp với nhu cầu khối lượng công việc của tổ chức.
Tính năng quản trị nhiệm vụ SageMaker HyperPod được cung cấp ở tất cả các Khu vực AWS đang hỗ trợ HyperPod: Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Bắc California), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Mumbai), Châu Á Thái Bình Dương (Singapore), Châu Á Thái Bình Dương (Sydney), Châu Á Thái Bình Dương (Tokyo), Châu Âu (Frankfurt), Châu Âu (Ireland), Châu Âu (London), Châu Âu (Stockholm) và Nam Mỹ (São Paulo).
Để tìm hiểu thêm, hãy truy cập trang web SageMaker HyperPod và tài liệu quản trị nhiệm vụ HyperPod.