Amazon Bedrock 現在支援可提高 RAG 應用程式準確性的 Rerank API
Amazon Bedrock 宣布透過 Rerank API 支援重新排名模型,讓開發人員能夠改善檢索增強生成 (RAG) 應用程式內的回應相關性。重新排名模型會根據一組所擷取文件與使用者查詢的相關性對其進行排名,可協助將最相關的內容優先傳送給基礎模型 (FM) 以產生回應。Amazon Bedrock 知識庫可提供完全受管的端對端 RAG 工作流程,透過整合來自各種資料來源的內容相關資訊來建立自訂生成式 AI 應用程式。Amazon Bedrock 知識庫使用者可透過 Retrieve 和 RetrieveAndGenerate API 中提供的設定來啟用重新排名。
RAG 系統中的語義搜索可以改善文件檢索相關性,但難以處理複雜或模糊的問題。例如,客戶服務聊天機器人在詢問如何退回線上購買的項目時,可能會擷取與退貨政策和運送準則有關的文件。如果沒有正確的排名,產生的回應可能會專注於運輸而非退貨,因此忽略使用者的意圖。現在,Amazon Bedrock 提供重新排名模型的存取權,這些模型將根據其與使用者查詢的相關性來重新排序擷取的文件,進而解決此問題。這可確保將最有用的資訊傳送至基礎模型以便產生回應,從而最佳化內容視窗使用情況,並有機會降低成本。
Rerank API 支援 Amazon Rerank 1.0 和 Cohere Rerank 3.5 模型。這些模型適用於美國西部 (奧勒岡)、加拿大 (中部)、歐洲 (法蘭克福) 和亞太地區 (東京)。
請瀏覽 Amazon Bedrock 產品文件。如需定價的詳細資訊,請參閱定價頁面。