Amazon ElastiCache 的向量搜索正式推出
Amazon ElastiCache 的向量搜索現已正式推出。客戶現在可以使用 ElastiCache 來索引、搜尋和更新來自 Amazon Bedrock、Amazon SageMaker、Anthropic 和 OpenAI 等熱門供應商的數十億個高維度向量嵌入內嵌,延遲最低可至微秒,並提供高達 99% 的查全率。
主要使用案例包括適用於大型語言模型 (LLM) 和多回合對話代理程式的語義快取,這可藉由快取語義相近的查詢來顯著降低延遲和成本。ElastiCache 的向量搜索還可透過檢索增強生成 (RAG) 為代理式 AI 系統提供支援,以確保提供高度相關的結果,並在多個擷取步驟中持續維持低延遲的表現。其他使用案例包括建議引擎、異常偵測以及其他需要跨多個資料模態進行高效搜尋的應用程式。
ElastiCache 的向量搜索功能可搭配所有 AWS 區域內節點型叢集上的 Valkey 8.2 版使用,無需額外費用。若要開始使用,請使用 AWS 管理主控台、AWS 軟體開發套件 (SDK) 或 AWS 命令列介面 (CLI) 建立 Valkey 8.2 叢集。您也可以在現有叢集上使用向量搜索,僅需按幾下滑鼠,即可在無需停機的情況下從任何版本的 Valkey 或 Redis OSS 升級到 Valkey 8.2。若要進一步了解 ElastiCache for Valkey 向量搜索的更多資訊,請參閱此部落格,如需支援的命令列表,請參閱 ElastiCache 文件。