发布于: Oct 5, 2023
Amazon Relational Database Service (RDS) for PostgreSQL 现在支持 pgvector 扩展 0.5.0 版本,用于将来自机器学习 (ML) 模型的嵌入内容存储在您的数据库中并执行高效的相似性搜索。该版本的扩展引入了 pgvector,引入了 HNSW 索引支持、ivfflat 索引构建的并行化,并提高了其距离函数的性能。
嵌入内容是从生成式人工智能创建的数字表示(向量),可将文本输入的语义含义捕获到大型语言模型 (LLM) 中。pgvector 可以存储和搜索来自 Amazon Bedrock、Amazon SageMaker 等的嵌入内容。借助 Amazon RDS 上的 pgvector,您只需为 GenAI 应用程序设置、操作和扩展数据库。pgvector 0.5.0 新增了对 HNSW 索引的支持,这让您能够以低延迟执行相似性搜索,并生成高度相关的结果。此外,pgvector 中的 HNSW 支持并发插入,以及从索引中更新/删除向量。您可以使用 LangChain 等开源框架将 GenAI 应用程序与 pgvector 集成,从而简化使用 Amazon RDS 搜索向量数据的方式。
pgvector 扩展 0.5.0 版本适用于所有适用 AWS 区域(包括 AWS GovCloud [US] 区域)内运行 PostgreSQL 15.4-R2 及更高版本、14.9-R2 及更高版本、13.12-R2 及更高版本和 12.16-R2 及更高版本的 Amazon RDS 中的数据库实例。
要开始使用,您可以直接从 AWS 管理控制台或 AWS CLI 启动新的 Amazon RDS 数据库实例。要了解有关 pgvector 的更多信息,请参阅 AWS 数据库博客和 Amazon RDS 用户指南。