Amazon Bedrock 現在支援 RAG 評估 (現已正式上市)
Amazon Bedrock RAG 評估現已正式上市。您可以評估檢索增強生成 (RAG) 應用程式,無論是以 Amazon Bedrock 知識庫為基礎建置的應用程式,還是以自訂 RAG 系統為基礎建置的應用程式。您可以評估擷取或端對端生成。評估由 LLM 即評判提供支援,並有多種評判模型可供選擇。您可以針對擷取選擇內容關聯性和覆蓋範圍等指標。對於端對端擷取和內容產生,您可以從正確性、完整性和忠實度 (幻覺偵測) 等品質指標及危害性、拒絕回答和刻板印象等負責任 AI 指標中進行選擇。您也可以進行評估工作之間的比較,以更迭您的知識庫或自訂 RAG 應用程式的不同設定 (如群集策略或向量長度、重新排名或不同的內容生成模型)。
*全新 - 更多的彈性!*從今天開始,除了 Bedrock 知識庫之外,Amazon Bedrock 的 RAG 評估也支援自訂 RAG 管道評估。現在,評估自訂 RAG 管道的客戶可以直接在其輸入資料集中,將輸入輸出對和擷取的內容帶入評估工作中,使他們能夠繞過對 Bedrock 知識庫的呼叫 (「自攜推理回應」)。我們也會為 Bedrock 知識庫評估新增引用精準和引用涵蓋範圍指標。如果您使用 Bedrock 知識庫作為評估的一部分,則可以直接納入 Amazon Bedrock 防護機制。
若要進一步了解,請造訪 Amazon Bedrock 評估頁面和文件。若要開始使用,請登入 Amazon Bedrock 主控台或使用 Amazon Bedrock API。