Amazon ElastiCache 现已支持向量与全文的实时混合搜索

发布于: 2026年5月6日

Amazon ElastiCache 现已支持实时混合搜索，能够在单个查询中结合向量相似度搜索与全文搜索，而无需单独的搜索服务。应用程序可以将语义含义与精准关键字匹配相结合，同时捕获意图和精确用词，从而提供比单独使用其中任一方法都更相关的结果。客户可以使用 ElastiCache 对来自 Amazon Bedrock、Amazon SageMaker、Anthropic 和 OpenAI 等热门提供商的数十亿个嵌入同时执行全文搜索和向量相似度搜索，延迟低至微秒，查全率高达 99%。

ElastiCache 可在写入完成后立即使数据变得可搜索，确保应用程序始终能搜索到最新的向量和文本。开发人员可以使用混合搜索来构建人工智能代理内存和 RAG 系统，通过精准用词和含义检索相关上下文，从而改进生成式人工智能响应，并降低词元成本。电商和流媒体平台可使用混合搜索来显示相关匹配项，无论用户是按精确的产品名称、描述进行搜索，还是同时按两者进行搜索。适用于 Valkey 的 ElastiCache 具备极少延迟的向量搜索能力，同时拥有超高吞吐量与极致性价比，在 AWS 主流向量数据库中的查全率可达 95% 以上。

混合搜索功能已在所有 AWS 商业区域、AWS GovCloud（美国）区域和中国区域推出，适用于基于节点的集群（运行适用于 Valkey 的 ElastiCache 9.0 版），且无需额外费用。Valkey 是 Redis 最宽松且供应商中立的开源替代方案，也是 ElastiCache 上推荐使用的引擎。要开始使用，可使用 AWS 管理控制台、AWS SDK 或 AWS CLI 创建新的 Valkey 9.0 或更高版本的集群，或升级现有集群。要了解更多信息，请参阅此博客并查看 ElastiCache 文档。

Amazon ElastiCache 现已支持向量与全文的实时混合搜索

了解

资源

开发人员

帮助