Publicado: Oct 5, 2023
Agora, o Amazon Relational Database Service (RDS) para PostgreSQL oferece suporte à extensão pgvector v0.5.0 para armazenar incorporações de modelos de machine learning (ML) em bancos de dados e realizar pesquisas de similaridade eficientes. Esta versão da extensão introduz o pgvector, o suporte à indexação HNSW e a paralelização de compilações de índices ivfflat, além de oferecer melhor performance de funções de distância.
As incorporações são representações numéricas (vetores) criadas por IA generativa que capturam o significado semântico de entradas de texto em um grande modelo de linguagem (LLM). O pgvector pode armazenar e pesquisar incorporações do Amazon Bedrock, Amazon SageMaker e muito mais. Com o pgvector no Amazon RDS, você simplifica a configuração, a operação e o ajuste de escala de bancos de dados para aplicações de GenAI. O pgvector 0.5.0 adiciona suporte à indexação HNSW, o que permite executar pesquisas de similaridade com baixa latência e resultados altamente relevantes. Além disso, o HNSW no pgvector oferece suporte a inserções simultâneas e atualização/exclusão de vetores do índice. Você pode integrar aplicações de GenAI ao pgvector usando estruturas de código aberto como o LangChain, simplificando a utilização do Amazon RDS para pesquisar dados vetoriais.
A extensão pgvector versão 0.5.0 está disponível em instâncias de banco de dados no Amazon RDS que executam as versões 15.4-R2, 14.9-R2, 13.12-R2 e 12.16-R2 ou superiores do PostgreSQL em todas as regiões aplicáveis da AWS, incluindo as regiões AWS GovCloud (EUA).
Você pode começar a usar lançando uma nova instância de banco de dados do Amazon RDS diretamente do Console da AWS ou da AWS CLI. Saiba mais sobre o pgvector no Blog de banco de dados da AWS e no Guia do usuário do Amazon RDS.