Thông báo hỗ trợ pgvector 0.7.0 trong Aurora PostgreSQL

Ngày đăng: 8 Th08 2024

Phiên bản Amazon Aurora tương thích với PostgreSQL hiện hỗ trợ pgvector 0.7.0 – một phần mở rộng mã nguồn mở dành cho PostgreSQL để lưu trữ các phần nhúng véc-tơ trong cơ sở dữ liệu của bạn. pgvector cung cấp chức năng tìm kiếm độ tương đồng của véc-tơ, cho phép sử dụng Aurora để tìm kiếm ngữ nghĩa và tạo tăng cường truy xuất (RAG) trong các ứng dụng trí tuệ nhân tạo (AI) tạo sinh.

pgvector 0.7.0 bổ sung cơ cấu song song để cải thiện thời gian xây dựng chỉ mục Hierarchical Navigable Small Worlds (HNSW) trong Aurora. pgvector 0.7.0 bổ sung hai kiểu dữ liệu véc-tơ mới: halfvec để lưu trữ kích thước dưới dạng số có dấu phẩy động 2 byte và sparsevec để lưu trữ tối đa 1.000 kích thước khác 0 và hiện hỗ trợ lập chỉ mục véc-tơ nhị phân sử dụng kiểu bit gốc PostgreSQL. Nội dung bổ sung này cho phép bạn sử dụng phương pháp lượng tử hóa vô hướng và nhị phân cho kiểu dữ liệu véc-tơ bằng cách sử dụng các chỉ mục biểu thức PostgreSQL, giúp giảm kích cỡ lưu trữ chỉ mục và giảm thời gian xây dựng chỉ mục. Phương pháp lượng tử hóa cũng cho phép bạn tăng kích thước tối đa của véc-tơ bạn có thể lập chỉ mục: 4.000 cho halfvec và 64.000 cho véc-tơ nhị phân.

pgvector 0.7.0 có trong các cụm Amazon Aurora chạy PostgreSQL 16.3, 15.7, 14.12, 13.15 và 12.19 trở lên ở tất cả các Khu vực AWS áp dụng ngoại trừ các khu vực ở Trung Quốc, nhưng gồm cả các Khu vực AWS GovCloud (Hoa Kỳ). Bạn có thể bắt đầu nâng cấp phiên bản phụ bằng cách sửa đổi cụm CSDL. Vui lòng xem tài liệu về Aurora để tìm hiểu thêm.

Amazon Aurora được thiết kế cho hiệu suất cao chưa từng có và độ sẵn sàng ở quy mô toàn cầu với khả năng tương thích hoàn toàn với MySQL và PostgreSQL. Amazon Aurora cung cấp khả năng bảo mật tích hợp, sao lưu liên tục, điện toán phi máy chủ, tối đa 15 bản sao chỉ có quyền đọc, sao chép tự động nhiều Khu vực và tích hợp với các dịch vụ AWS khác. Để bắt đầu sử dụng Amazon Aurora, hãy xem trang bắt đầu của chúng tôi.