Khả năng quan sát của Amazon CloudWatch GenAI hiện đã hỗ trợ Đánh giá Amazon AgentCore
Amazon CloudWatch hiện đã cho phép đánh giá chất lượng tự động của tác tử AI thông qua Đánh giá AgentCore. Tính năng mới này giúp các nhà phát triển liên tục theo dõi và cải thiện hiệu năng của tác tử dựa trên tương tác trong thế giới thực, cho phép các đội ngũ xác định và giải quyết các vấn đề về chất lượng trước khi các vấn đề này tác động đến khách hàng.
Đánh giá AgentCore đi kèm 13 bộ đánh giá được xây dựng sẵn, bao hàm các khía cạnh chất lượng thiết yếu như tính hữu ích, lựa chọn công cụ và độ chính xác của phản hồi, đồng thời, hỗ trợ các hệ thống chấm điểm theo mô hình tùy chỉnh. Bạn có thể truy cập các chỉ số chất lượng thống nhất và phương pháp đo lường từ xa cho tác tử trong bảng thông tin CloudWatch, với khả năng theo dõi toàn diện từ đầu đến cuối các chỉ số đánh giá so sánh tương quan với câu lệnh và bản ghi. Tính năng này tích hợp liền mạch với các tính năng hiện có của CloudWatch, bao gồm Tín hiệu về ứng dụng, Cảnh báo, Bảo vệ dữ liệu nhạy cảm và Thông tin chuyên sâu về bản ghi. Tính năng này giúp các đội ngũ không cần phải xây dựng và duy trì cơ sở hạ tầng đánh giá tùy chỉnh, qua đó tăng tốc độ triển khai tác tử AI chất lượng cao. Các nhà phát triển có thể giám sát toàn bộ nhóm tác tử của mình thông qua phần AgentCore trong bảng thông tin khả năng quan sát CloudWatch GenAI.
Tính năng Đánh giá AgentCore hiện được cung cấp ở Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon), Châu Âu (Frankfurt) và Châu Á Thái Bình Dương (Sydney). Để bắt đầu, hãy truy cập tài liệu và thông tin chi tiết về giá. Giá CloudWatch tiêu chuẩn áp dụng cho dữ liệu đo lường từ xa cơ sở.