亚马逊AWS官方博客

Amazon OpenSearch 无服务器的向量引擎现已推出



今天,我们宣布 Amazon OpenSearch 无服务器的向量引擎正式发布,并增加了新功能。2023 年 7 月,我们推出了 Amazon OpenSearch 无服务器的向量引擎预览版,这是一项简单、可扩展且高性能的相似度搜索功能。向量引擎可让您轻松构建现代机器学习(ML)增强型搜索体验和生成式人工智能(生成式 AI)应用程序,而无需管理底层的向量数据库基础设施。

现在,您可以在几毫秒内存储、更新和搜索数十亿个具有数千个维度的向量嵌入。向量引擎的高性能相似度搜索功能可让生成式人工智能驱动的应用程序以一致的毫秒级响应时间提供准确可靠的结果。

向量引擎还可以通过在同一个查询中将向量搜索和全文搜索相结合,使用混合搜索来优化和调整结果,从而无需管理和维护单独的数据存储或复杂的应用程序堆栈。向量引擎提供了一个安全、可靠、可扩展的企业级平台,可经济高效地构建原型设计应用程序,然后无缝扩展到生产环境。

现在,通过创建基于向量引擎的专用集合(该集合是一个协同工作的嵌入式逻辑分组,可支持工作负载),您可以在几分钟内开始使用向量引擎。

向量引擎使用计算容量单位 OpenSearch 计算单位(OCU)来提取和运行相似度搜索查询。一个 OCU 可以处理多达 200 万个 128 个维度的向量,或 50 万个 768 个维度的向量,召回率为 99%。

默认情况下,基于 OpenSearch 无服务器构建的向量引擎是一项高度可用的服务。对于一个账户中的第一个集合,它至少需要四个 OCU(2 个 OCU 用于提取,包括主要和备用;2 个 OCU 用于搜索,其中包含两个跨可用区的活动副本)。使用相同 AWS Key Management Service(AWS KMS)密钥的所有后续集合都可以共享这些 OCU。

正式发行版新增功能
自预览版发布以来,Amazon OpenSearch 无服务器的向量引擎就成为了 Amazon Bedrock 中的一个向量数据库选项,用于使用检索式增强生成(RAG)概念构建生成式人工智能应用程序。

以下是此正式发行版的一些新增或改进功能:

禁用冗余副本(侧重于开发和测试)选项
正如我们的预览版博客文章中宣称的那样,该功能使得在另一个可用区中无需仅出于可用性目的而设置冗余 OCU。一个集合可以使用两个 OCU 进行部署 – 一个用于索引,一个用于搜索。与使用冗余副本的默认部署相比,这可以降低一半成本。成本的降低使得这一配置适用于开发和测试工作负载且经济实惠。

在此选项中,我们仍将提供耐用性保证,因为虽然向量引擎会将所有数据保存在 Amazon S3 中,但单可用区故障会影响您的可用性。

如果要禁用冗余副本,请在创建新的向量搜索集合时取消选中启用冗余

适用于侧重开发和测试的部分 OCU 选项
对于侧重于开发和测试的工作负载,支持对部分 OCU 计费(即没有冗余副本选项)可降低向量搜索集合的最低价格。向量引擎最初会部署较小的 0.5 个 OCU,同时在较小的规模下提供相同的功能,随后会纵向扩展到完整的 OCU 及更大规模,以满足您的工作负载需求。尝试使用向量引擎时,该选项会进一步降低每月成本。

十亿级自动扩缩
借助向量引擎的无缝自动扩缩,您将无需再为扩缩而重建索引。在预览版中,我们支持大约 2000 万个向量嵌入。随着向量引擎的正式推出,我们提高了限制,可支持十亿向量级。

现已推出
Amazon OpenSearch 无服务器的向量引擎现已在所有提供 Amazon OpenSearch 无服务器的 AWS 区域推出。

要开始使用,您可以参考以下资源:

立即试用,并将反馈发送至 AWS re:Post for Amazon OpenSearch Service 或通过您通常的 AWS Support 联系方式发送反馈。

Channy