AWS ParallelCluster 3.15 hỗ trợ P6-B300 và Slurm 25.11
AWS ParallelCluster 3.15 hiện đã được cung cấp rộng rãi. Bản phát hành này bổ sung hỗ trợ các loại phiên bản P6-B300 và nâng cấp Slurm lên phiên bản 25.11 với tính năng xếp hàng lại công việc nhanh chóng.
Với hỗ trợ P6-B300, bạn có thể chạy các khối lượng công việc AI/ML đòi hỏi cao và điện toán hiệu năng cao trên cơ sở hạ tầng GPU NVIDIA Blackwell mới nhất. Bản phát hành này cải thiện các cài đặt mặc định cho cấu hình mạng EFA và hỗ trợ tùy chỉnh giao diện mạng. Để tìm hiểu cách tùy chỉnh giao diện mạng, hãy xem Tùy chỉnh giao diện mạng cho nút điện toán với phần ghi đè mẫu khởi chạy. Các hạng mục cải tiến khác bao gồm bản cập nhật cụm đáng tin cậy hơn, cải thiện hiệu năng cho khối lượng công việc gắn chặt trong các cụm lớn và hỗ trợ cập nhật thẻ cụm mà không bị gián đoạn. Để biết thêm thông tin chi tiết, hãy xem thông báo phát hành AWS ParallelCluster 3.15.0.
AWS ParallelCluster là công cụ quản lý cụm nguồn mở cho phép khách hàng thuộc lĩnh vực Nghiên cứu và phát triển và quản trị viên CNTT vận hành các cụm điện toán hiệu năng cao (HPC) trên AWS. ParallelCluster được thiết kế để cung cấp tự động và an toàn các tài nguyên đám mây cho các cụm HPC điều chỉnh quy mô linh hoạt, có khả năng chạy khối lượng công việc khoa học và kỹ thuật ở quy mô lớn trên AWS. ParallelCluster được cung cấp mà không mất thêm phí ở các Khu vực AWS được liệt kê tại đây và bạn chỉ cần trả phí cho tài nguyên AWS cần thiết để chạy ứng dụng của mình.
Để tìm hiểu thêm về cách khởi chạy cụm HPC trên AWS, hãy truy cập Hướng dẫn sử dụng ParallelCluster. Để bắt đầu sử dụng ParallelCluster, hãy xem hướng dẫn cài đặt UI và CLI ParallelCluster.