Amazon ElastiCache 的向量搜索正式推出

張貼日期: 2025年10月13日

Amazon ElastiCache 的向量搜索現已正式推出。客戶現在可以使用 ElastiCache 來索引、搜尋和更新來自 Amazon Bedrock、Amazon SageMaker、Anthropic 和 OpenAI 等熱門供應商的數十億個高維度向量嵌入內嵌，延遲最低可至微秒，並提供高達 99% 的查全率。

主要使用案例包括適用於大型語言模型 (LLM) 和多回合對話代理程式的語義快取，這可藉由快取語義相近的查詢來顯著降低延遲和成本。ElastiCache 的向量搜索還可透過檢索增強生成 (RAG) 為代理式 AI 系統提供支援，以確保提供高度相關的結果，並在多個擷取步驟中持續維持低延遲的表現。其他使用案例包括建議引擎、異常偵測以及其他需要跨多個資料模態進行高效搜尋的應用程式。

ElastiCache 的向量搜索功能可搭配所有 AWS 區域內節點型叢集上的 Valkey 8.2 版使用，無需額外費用。若要開始使用，請使用 AWS 管理主控台、AWS 軟體開發套件 (SDK) 或 AWS 命令列介面 (CLI) 建立 Valkey 8.2 叢集。您也可以在現有叢集上使用向量搜索，僅需按幾下滑鼠，即可在無需停機的情況下從任何版本的 Valkey 或 Redis OSS 升級到 Valkey 8.2。若要進一步了解 ElastiCache for Valkey 向量搜索的更多資訊，請參閱此部落格，如需支援的命令列表，請參閱 ElastiCache 文件。

Amazon ElastiCache 的向量搜索正式推出

了解

資源

開發人員

說明