Veröffentlicht am: Oct 5, 2023
Amazon Relational Database Service (RDS) für PostgreSQL unterstützt jetzt die Version V0.5.0 der pgvector-Erweiterung, um Einbettungen von Machine Learning (ML)-Modellen in Ihrer Datenbank zu speichern und um effiziente Ähnlichkeitssuchen durchzuführen. Diese Version der pgvector-Erweiterung führt die Unterstützung der HNSW-Indizierung, die Parallelisierung der ivfflat-Indexerstellung und eine verbesserte Leistung der Distanzfunktionen ein.
Einbettungen sind numerische Darstellungen (Vektoren), die mithilfe generativer KI erstellt wurden und die semantische Bedeutung von Texteingaben in einem großen Sprachmodell (LLM) erfassen. pgvector kann Einbettungen von Amazon Bedrock, Amazon SageMaker und anderen Services speichern und suchen. Mit pgvector auf Amazon RDS können Sie Datenbanken für Ihre GenAI-Anwendungen einfach einrichten, betreiben und skalieren. Mit pgvector 0.5.0 wird die Unterstützung für HNSW-Indizierung hinzugefügt, mit der Sie Ähnlichkeitssuchen mit geringer Latenz durchführen und hoch relevante Ergebnisse erzielen können. Zusätzlich unterstützt HNSW in pgvector gleichzeitige Einfügungen und das Aktualisieren/Löschen von Vektoren aus dem Index. Über Open-Source-Frameworks wie LangChain können Sie Ihre GenAI-Anwendungen mit pgvector integrieren und so den Einsatz von Amazon RDS für die Suche in Ihren Vektordaten vereinfachen.
Die pgvector-Erweiterung Version 0.5.0 ist auf Datenbank-Instances in Amazon RDS mit PostgreSQL 15.4-R2 und höher, 14.9-R2 und höher, 13.12-R2 und höher sowie 12.16-R2 und höher in allen zutreffenden AWS-Regionen verfügbar, einschließlich der Regionen AWS GovCloud (USA).
Zum Einstieg können Sie eine neue Amazon-RDS-DB-Instance direkt über die AWS-Konsole oder die AWS CLI aus starten. Mehr über pgvector erfahren Sie im AWS-Datenbank-Blog und im Amazon-RDS-Benutzerhandbuch.