Amazon SageMaker HyperPod hiện xác thực hạn mức dịch vụ trước khi tạo cụm trên bảng điều khiển
Bảng điều khiển Amazon SageMaker HyperPod giờ đây sẽ xác thực hạn mức dịch vụ cho tài khoản AWS của bạn trước khi tiến hành tạo cụm, cho phép bạn xác nhận rằng bạn có đủ hạn mức khả dụng trước khi bắt đầu cung cấp. SageMaker HyperPod giúp bạn cung cấp các cụm có khả năng phục hồi cao để chạy khối lượng công việc AI/ML và phát triển các mô hình hiện đại, như: mô hình ngôn ngữ lớn (LLM), mô hình khuếch tán và mô hình nền tảng (FM).
Khi tạo cụm AI/ML trên quy mô lớn, bạn cần đảm bảo rằng tài khoản có đủ hạn mức cho phiên bản, dung lượng lưu trữ và tài nguyên mạng, nhưng việc xác thực hạn mức trước đây từng yêu cầu kiểm tra thủ công với nhiều dịch vụ AWS, do đó thường dẫn đến việc tạo cụm không thành công và lãng phí thời gian nếu bạn quên không yêu cầu tăng hạn mức. Khả năng xác thực hạn mức mới trong bảng điều khiển SageMaker HyperPod sẽ tự động kiểm tra hạn mức ở cấp độ tài khoản của bạn so với cấu hình cụm của bạn, bao gồm giới hạn loại phiên bản, kích thước ổ đĩa EBS và các hạn mức liên quan đến VPC khi tạo tài nguyên mới. Tính năng xác thực sẽ hiển thị một bảng hiển thị rõ ràng mức sử dụng dự kiến, giá trị hạn mức được áp dụng và trạng thái tuân thủ cho từng hạn mức. Khi hạn mức có thể bị vượt quá, bạn sẽ nhận được cảnh báo kèm với liên kết trực tiếp đến bảng điều khiển Hạn mức dịch vụ để yêu cầu tăng thêm.
Tính năng này được cung cấp ở tất cả các Khu vực AWS có hỗ trợ Amazon SageMaker HyperPod. Để biết danh sách đầy đủ các lượt kiểm tra xác thực hạn mức dịch vụ được thực hiện, hãy tham khảo Hướng dẫn sử dụng Amazon SageMaker HyperPod.