Đánh giá mô hình trên Amazon Bedrock hiện được cung cấp ở Châu Âu (Zurich)
Đánh giá mô hình trên Amazon Bedrock cho phép bạn đánh giá, so sánh và chọn mô hình nền tảng tốt nhất cho trường hợp sử dụng của mình. Amazon Bedrock cung cấp sự lựa chọn sử dụng cách đánh giá theo chương trình dựa trên LLM-as-a-judge (LLM làm công cụ đánh giá) và con người đánh giá. Bạn có thể sử dụng LLM-as a-judge (LLM làm công cụ đánh giá) cho các chỉ số như tính chính xác, tính đầy đủ và tính nhất quán, cũng như các chỉ số AI có trách nhiệm như tính gây hại và mức độ từ chối trả lời. Tùy chọn đánh giá theo chương trình cung cấp thuật toán cho các chỉ số như độ chính xác, độ mạnh mẽ và độ độc hại. Ngoài ra, đối với các chỉ số đó hoặc các chỉ số tùy chỉnh và mang tính chủ quan như độ thân thiện hoặc phong cách, bạn có thể thiết lập quy trình để con người đánh giá chỉ với vài thao tác nhấp chuột. Trong quy trình này, bạn có thể tận dụng nhân viên của chính mình hoặc nhóm do AWS quản lý làm người đánh giá. Đánh giá mô hình cung cấp tập dữ liệu tích hợp sẵn được tuyển chọn hoặc bạn có thể sử dụng tập dữ liệu riêng. Bây giờ, khách hàng có thể đánh giá các mô hình ở Châu Âu (Zurich).
Đánh giá mô hình trên Amazon Bedrock hiện được cung cấp ở các khu vực này, nhưng các loại đánh giá có thể dùng sẽ thay đổi theo khu vực.
Để tìm hiểu thêm về Đánh giá Mô hình trên Amazon Bedrock, hãy xem trang Đánh giá trên Amazon Bedrock. Để bắt đầu, hãy đăng nhập vào Amazon Bedrock trên Bảng điều khiển quản lý AWS hoặc sử dụng API Amazon Bedrock.