Guardrails dành cho Amazon Bedrock giờ đây có thể phát hiện ảo giác và bảo vệ các ứng dụng sử dụng bất kỳ FM nào

Ngày đăng: 10 Th07 2024

Guardrails dành cho Amazon Bedrock cho phép khách hàng thực hiện các biện pháp bảo vệ dựa trên yêu cầu đối với ứng dụng và chính sách AI có trách nhiệm của họ. Hôm nay, Guardrails sẽ bổ sung các mục kiểm tra nền tảng theo ngữ cảnh và giới thiệu một API ApplyGuardrail mới để xây dựng các ứng dụng AI tạo sinh đáng tin cậy, sử dụng bất kỳ mô hình nền tảng (FM) nào.

Khách hàng tin cậy vào khả năng vốn có của FM để tạo ra các phản hồi có căn cứ (đáng tin cậy) dựa trên dữ liệu nguồn của công ty. Tuy nhiên, FM có thể kết hợp nhiều mẩu thông tin, tạo ra thông tin mới hoặc không chính xác làm ảnh hưởng đến độ tin cậy của ứng dụng. Với các mục kiểm tra nền tảng theo ngữ cảnh, Guardrails giờ đây có thể phát hiện ảo giác trong các phản hồi của mô hình đối với các ứng dụng RAG (tạo tăng cường truy xuất) và trò chuyện. Biện pháp bảo vệ này giúp phát hiện và lọc các phản hồi không chính xác trên thực tế, dựa trên nguồn tham chiếu và không liên quan đến truy vấn của người dùng. Khách hàng có thể cấu hình ngưỡng tin cậy để lọc các phản hồi có độ tin cậy thấp về căn cứ hoặc mức độ liên quan.

Ngoài ra, để hỗ trợ sự lựa chọn bảo vệ ứng dụng sử dụng các FM khác nhau, Guardrails hiện hỗ trợ API ApplyGuardrail để đánh giá dữ liệu đầu vào của người dùng và phản hồi của mô hình đối với bất kỳ FM tùy chỉnh và FM của bên thứ ba nào, ngoài các FM đã được hỗ trợ trong Amazon Bedrock. API ApplyGuardrail này giúp bảo đảm độ an toàn và sự quản trị tập trung đối với tất cả các ứng dụng AI tạo sinh của bạn.

Guardrails là dịch vụ duy nhất từ một nhà cung cấp dịch vụ đám mây lớn có thể mang đến các biện pháp bảo vệ an toàn, quyền riêng tư và sự trung thực trong một giải pháp. Kiểm tra nền tảng theo ngữ cảnh và API ApplyGuardrail được hỗ trợ ở tất cả các khu vực AWS có hỗ trợ Guardrails dành cho Amazon Bedrock.

Để tìm hiểu thêm về Guardrails dành cho Amazon Bedrock, hãy truy cập trang tính năng và đọc blog tin tức.