投稿日: Oct 5, 2023
Amazon Relational Database Service (RDS) for PostgreSQL は、pgvector 拡張機能 v0.5.0 に対応しました。これにより、機械学習 (ML) モデルの埋め込みをデータベースに保存し、効率的な類似検索を実行できます。このバージョンの pgvector 拡張機能では、HNSW インデックス作成のサポートと ivfflat インデックス構築の並行実行が導入され、距離関数のパフォーマンスが向上しています。
埋め込みとは、大規模言語モデル (LLM) に入力されたテキストのセマンティックな意味を取り込む生成系 AI から作成される数値表現 (ベクトル) です。pgvector は、Amazon Bedrock や Amazon SageMaker などの埋め込みの保存および検索を可能にします。Amazon RDS で pgvector を使用すると、GenAI アプリケーション用にデータベースを簡単にセットアップし、運用し、スケールできます。pgvector 0.5.0 では、HNSW インデックス作成のサポートが追加されています。これにより、類似検索を低レイテンシーで実行でき、関連性の高い結果が得られます。さらに、pgvector の HNSW は、同時挿入と、インデックスからのベクトルの更新や削除をサポートしています。LangChain などのオープンソースフレームワークを使用して GenAI アプリケーションを pgvector と統合できるため、Amazon RDS を使用してベクトルデータを簡単に検索できるようになります。
pgvector 拡張機能バージョン 0.5.0 は、PostgreSQL 15.4-R2 以降、14.9-R2 以降、13.12-R2 以降、12.16-R2 以降を実行している Amazon RDS のデータベースインスタンスで、AWS GovCloud (米国) リージョンを含む該当するすべての AWS リージョンでご利用いただけます。
新しい Amazon RDS DB インスタンスは、AWS コンソールまたは AWS CLI から直接起動して使用を開始できます。pgvector の詳細については、AWS Database Blog (AWS データベースブログ) と Amazon RDS ユーザーガイドをご覧ください。