宣布推出 Amazon ElastiCache 向量搜索功能

发布于: 2025年10月13日

Amazon ElastiCache 向量搜索功能现已全面推出。客户现在可以使用 ElastiCache 对来自 Amazon BedrockAmazon SageMakerAnthropicOpenAI 等热门提供商的数十亿个高维向量嵌入进行索引、搜索和更新,延迟低至微秒,查全率高达 99%。

主要使用案例包括大语言模型(LLM)和多轮对话代理的语义缓存,通过缓存语义相似的查询,显著降低延迟和成本。ElastiCache 向量搜索功能还通过检索增强生成(RAG)为代理式人工智能系统提供支持,以确保在多个检索步骤中获得高度相关的结果并保持低延迟。其他使用案例包括推荐引擎、异常检测和其他需要跨多种数据模态进行高效搜索的应用程序。

ElastiCache 向量搜索功能已在所有 AWS 区域的节点型集群上的 Valkey 版本 8.2 中推出,无额外费用。要开始使用,您可以通过 AWS 管理控制台、AWS 软件开发工具包(SDK)或 AWS 命令行界面(CLI)来创建 Valkey 8.2 集群。您还可以通过以下方式在现有集群上使用向量搜索功能:单击几下,无需停机,从任何版本的 Valkey 或 Redis OSS 升级到 Valkey 8.2 版本。要详细了解适用于 Valkey 的 ElastiCache 向量搜索功能,请阅读此博客,有关受支持命令的列表,请参阅 ElastiCache 文档。