Amazon SageMaker HyperPod công bố chức năng quan sát mới
Khả năng quan sát mới của Amazon SageMaker HyperPod cho phép khách hàng đẩy nhanh quá trình phát triển mô hình AI tạo sinh bằng cách cung cấp khả năng hiển thị toàn diện trên các tài nguyên điện toán và tác vụ phát triển mô hình. Loại bỏ thao tác thủ công trong việc thu thập hàng trăm chỉ số từ toàn bộ tầng hệ thống, trực quan hóa mối tương quan giữa các chỉ số và khôi phục hiệu suất của tác vụ phát triển mô hình AI tạo sinh. Khả năng quan sát HyperPod giúp theo dõi các chỉ số hiệu suất tác vụ theo thời gian thực, cảnh báo khách hàng khi có chỉ số nào đó xấu đi và tự động khắc phục nguyên nhân gốc rễ bằng các chính sách do khách hàng xác định.
Khả năng quan sát của SageMaker HyperPod thay đổi cách khách hàng giám sát và tối ưu hóa các tác vụ phát triển mô hình AI tạo sinh. Nhờ có bảng điều khiển hợp nhất được cấu hình sẵn trong Grafana được quản lý của Amazon với dữ liệu giám sát được đăng tự động lên không gian làm việc Prometheus được quản lý của Amazon, từ giờ, khách hàng có thể xem các chỉ số hiệu suất tác vụ AI tạo sinh, sử dụng tài nguyên và tình trạng của cụm trong một chế độ xem duy nhất. Điều này cho phép các nhóm nhanh chóng phát hiện điểm nghẽn, ngăn ngừa các tình huống chậm trễ gây tốn kém và tối ưu hóa tài nguyên điện toán. Khách hàng có thể xác định cảnh báo tự động, lấy được chỉ số tác vụ cụ thể theo trường hợp sử dụng và hiển thị lên bảng điều khiển hợp nhất chỉ với một vài cú nhấp chuột. Bằng việc giảm thời gian khắc phục sự cố từ vài ngày xuống còn vài phút, chức năng này giúp khách hàng đẩy nhanh quá trình đưa mô hình vào sử dụng và tối đa hóa lợi nhuận đầu tư vào AI.
Khả năng quan sát của SageMaker HyperPod được cung cấp ở tất cả các Khu vực AWS nơi có SageMaker HyperPod, ngoại trừ Miền Tây Hoa Kỳ (Bắc California) và Châu Á Thái Bình Dương (Melbourne). Để tìm hiểu thêm và bắt đầu, hãy truy cập blog, tài liệu và trang web SageMaker HyperPod.