Amazon Bedrock 知識庫現在支援串流回應

張貼日期: 2024年12月1日

Amazon Bedrock 知識庫提供全受管的端對端檢索增強生成 (RAG) 工作流程，透過整合公司資料來源的內容資訊來建立高度精確、低延遲、安全且可自訂的檢索增強生成 GenAI 應用程式。今天，我們宣布 Bedrock 知識庫支援 RetrieveAndGenerateStream API。這個新的串流 API 可讓 Bedrock 知識庫客戶在大型語言模型 (LLM) 產生回應的同時進行接收，而無須等待完整的回應。

RAG 工作流程涉及數個步驟，包括查詢資料存放區、收集相關內容，然後將查詢傳送至 LLM 以進行回應摘要。產生回應的最後一步可能需要幾秒鐘，具體取決於產生回應時所用基礎模型的延遲情形。為了在建置延遲敏感型應用程式時減少這種延遲，我們現在提供 RetrieveAndGenerateStream API，該 API 會在模型產生回應的同時，以串流形式提供該回應。這會減少第一次回應的延遲，在使用者與 Bedrock 知識庫互動時提供更順暢且更快速的體驗。

目前所有現有 Amazon Bedrock 知識庫區域都支援此新功能。若要進一步了解，請瀏覽文件。

Amazon Bedrock 知識庫現在支援串流回應

了解

資源

開發人員

說明