Amazon ElastiCache 现已支持向量与全文的实时混合搜索

发布于: 2026年5月6日

Amazon ElastiCache 现已支持实时混合搜索,能够在单个查询中结合向量相似度搜索与全文搜索,而无需单独的搜索服务。应用程序可以将语义含义与精准关键字匹配相结合,同时捕获意图和精确用词,从而提供比单独使用其中任一方法都更相关的结果。客户可以使用 ElastiCache 对来自 Amazon BedrockAmazon SageMakerAnthropicOpenAI 等热门提供商的数十亿个嵌入同时执行全文搜索和向量相似度搜索,延迟低至微秒,查全率高达 99%。

ElastiCache 可在写入完成后立即使数据变得可搜索,确保应用程序始终能搜索到最新的向量和文本。开发人员可以使用混合搜索来构建人工智能代理内存和 RAG 系统,通过精准用词和含义检索相关上下文,从而改进生成式人工智能响应,并降低词元成本。电商和流媒体平台可使用混合搜索来显示相关匹配项,无论用户是按精确的产品名称、描述进行搜索,还是同时按两者进行搜索。适用于 Valkey 的 ElastiCache 具备极少延迟的向量搜索能力,同时拥有超高吞吐量与极致性价比,在 AWS 主流向量数据库中的查全率可达 95% 以上。

混合搜索功能已在所有 AWS 商业区域、AWS GovCloud(美国)区域和中国区域推出,适用于基于节点的集群(运行适用于 Valkey 的 ElastiCache 9.0 版),且无需额外费用。Valkey 是 Redis 最宽松且供应商中立的开源替代方案,也是 ElastiCache 上推荐使用的引擎。要开始使用,可使用 AWS 管理控制台、AWS SDK 或 AWS CLI 创建新的 Valkey 9.0 或更高版本的集群,或升级现有集群。要了解更多信息,请参阅此博客并查看 ElastiCache 文档