宣布推出 Amazon ElastiCache 向量搜索功能

发布于: 2025年10月13日

Amazon ElastiCache 向量搜索功能现已全面推出。客户现在可以使用 ElastiCache 对来自 Amazon Bedrock、Amazon SageMaker、Anthropic 和 OpenAI 等热门提供商的数十亿个高维向量嵌入进行索引、搜索和更新，延迟低至微秒，查全率高达 99%。

主要使用案例包括大语言模型（LLM）和多轮对话代理的语义缓存，通过缓存语义相似的查询，显著降低延迟和成本。ElastiCache 向量搜索功能还通过检索增强生成（RAG）为代理式人工智能系统提供支持，以确保在多个检索步骤中获得高度相关的结果并保持低延迟。其他使用案例包括推荐引擎、异常检测和其他需要跨多种数据模态进行高效搜索的应用程序。

ElastiCache 向量搜索功能已在所有 AWS 区域的节点型集群上的 Valkey 版本 8.2 中推出，无额外费用。要开始使用，您可以通过 AWS 管理控制台、AWS 软件开发工具包（SDK）或 AWS 命令行界面（CLI）来创建 Valkey 8.2 集群。您还可以通过以下方式在现有集群上使用向量搜索功能：单击几下，无需停机，从任何版本的 Valkey 或 Redis OSS 升级到 Valkey 8.2 版本。要详细了解适用于 Valkey 的 ElastiCache 向量搜索功能，请阅读此博客，有关受支持命令的列表，请参阅 ElastiCache 文档。

宣布推出 Amazon ElastiCache 向量搜索功能

了解

资源

开发人员

帮助