게시된 날짜: Oct 5, 2023
이제 Amazon Relational Database Service (RDS) for PostgreSQL은 데이터베이스에 기계 학습(ML) 모델의 임베딩을 저장하고 효율적인 유사성 검색을 수행할 수 있는 pgvector 확장 v0.5.0을 지원합니다. 이 pgvector 확장 버전에서는 HNSW 인덱싱 지원과 ivfflat 인덱스 빌드 병렬화를 도입하고 거리 함수의 성능을 개선합니다.
임베딩은 대규모 언어 모델(LLM)에 입력된 텍스트의 의미론적 의미를 캡처하는 생성형 AI에서 생성된 숫자 표현(벡터)입니다. pgvector는 Amazon Bedrock, Amazon SageMaker 등의 임베딩을 저장하고 검색할 수 있습니다. Amazon RDS에서 pgvector를 사용하면 생성형 AI 애플리케이션을 위한 데이터베이스를 간단하게 설정 및 운영하고 규모를 조정할 수 있습니다. pgvector 0.5.0은 HNSW 인덱싱을 지원하므로, 짧은 지연 시간으로 유사성 검색을 실행하고 매우 정확한 결과를 생성할 수 있습니다. 아울러 pgvector의 HNSW는 동시 삽입과 인덱스에서 벡터 업데이트/삭제를 지원합니다. LangChain과 같은 오픈 소스 프레임워크를 사용하여 생성형 AI 애플리케이션을 pgvector와 통합하면, Amazon RDS를 사용해 벡터 데이터를 검색하는 방법을 간소화할 수 있습니다.
pgvector 확장 버전 0.5.0은 AWS GovCloud(미국) 리전을 비롯하여 해당하는 모든 AWS 리전에서 PostgreSQL 15.4-R2 이상, 14.9-R2 이상, 13.12-R2 이상, 12.16-R2 이상을 실행하는 Amazon RDS의 데이터베이스 인스턴스에서 사용할 수 있습니다.
AWS Console 또는 AWS CLI에서 직접 새로운 Amazon RDS DB 인스턴스를 구동하여 시작할 수 있습니다. AWS 데이터베이스 블로그와 Amazon RDS 사용 설명서에서 pgvector에 대해 자세히 알아보세요.