게시된 날짜: May 10, 2024
이제 Amazon Relational Database Service(RDS) for PostgreSQL은 데이터베이스에 벡터 임베딩을 저장하기 위한 PostgreSQL용 오픈 소스 확장인 pgvector 0.7.0을 지원하므로, 생성 AI 애플리케이션을 구축할 때 검색 증강 생성(RAG)을 사용할 수 있습니다. 이번 pgvector 릴리스에는 인덱싱할 수 있는 벡터의 차원 수를 늘리고 인덱스 크기를 줄이는 기능, 거리 계산에서 CPU SIMD를 사용하기 위한 추가 지원 등이 포함되어 있습니다.
pgvector 0.7.0에는 차원을 2바이트 부동 소수점으로 저장하는 halfvec과 최대 1,000개의 0이 아닌 차원을 저장하는 sparsevec이라는 두 가지 새로운 벡터 데이터 유형이 추가되었으며, 이제 PostgreSQL 기본 비트 유형을 사용하여 이진 벡터를 인덱싱하는 것이 지원됩니다. 이러한 추가 기능을 통해 PostgreSQL 표현식 인덱스를 사용하여 벡터 데이터 유형에 스칼라 및 이진 양자화를 사용할 수 있습니다. 따라서 인덱스의 스토리지 크기가 줄어들고 인덱스 빌드 시간이 단축됩니다. 양자화를 사용하면 인덱싱할 수 있는 벡터의 최대 차원(halfvec의 경우 4,000, 이진 벡터의 경우 64,000)을 늘릴 수 있습니다. 또한 pgvector 0.7.0에는 이진 벡터의 해밍 거리와 자카드 거리를 모두 계산하는 함수도 추가되었습니다.
pgvector 0.7.0은 AWS GovCloud(미국) 리전을 비롯하여 해당하는 모든 AWS 리전에서 PostgreSQL 16.3 이상, 15.7 이상, 14.12 이상, 13.15 이상, 12.19 이상을 실행하는 Amazon RDS의 모든 데이터베이스 인스턴스에서 사용할 수 있습니다.
Amazon RDS for PostgreSQL을 사용하면 클라우드에서 PostgreSQL 배포를 간편하게 설정 및 운영하고 규모를 조정할 수 있습니다. 요금 내역 및 지역별 가용성은 Amazon RDS for PostgreSQL 요금을 참조하세요. Amazon RDS Management Console에서 완전관리형 Amazon RDS 데이터베이스를 생성하거나 업데이트하세요.