Ra mắt tính năng tìm kiếm theo véc-tơ cho Amazon ElastiCache
Tính năng tìm kiếm theo véc-tơ cho Amazon ElastiCache hiện đã chính thức ra mắt. Khách hàng hiện có thể sử dụng ElastiCache để lập chỉ mục, tìm kiếm và cập nhật hàng tỷ nội dung véc-tơ nhúng đa chiều từ các nhà cung cấp phổ biến như Amazon Bedrock, Amazon SageMaker, Anthropic và OpenAI, với độ trễ thấp và tỷ lệ truy xuất lên đến 99%.
Các trường hợp sử dụng chính bao gồm bộ nhớ đệm ngữ nghĩa cho các mô hình ngôn ngữ lớn (LLM) và các tác tử hội thoại đa lượt, giúp giảm đáng kể độ trễ và chi phí bằng cách lưu trữ các truy vấn có ngữ nghĩa tương tự. Tính năng tìm kiếm theo véc-tơ của ElastiCache cũng hỗ trợ các hệ thống AI trợ lý ảo sử dụng Tạo có kết hợp truy xuất thông tin ngoài (RAG), giúp đảm bảo kết quả có mức độ liên quan cao và độ trễ thấp ổn định trong nhiều bước truy xuất dữ liệu. Các trường hợp sử dụng bổ sung bao gồm công cụ đề xuất, phát hiện bất thường và các ứng dụng khác yêu cầu khả năng tìm kiếm hiệu quả trên nhiều loại dữ liệu.
Tính năng tìm kiếm theo véc-tơ cho ElastiCache đã được cung cấp với phiên bản Valkey 8.2 trên cụm dựa trên nút sử dụng tại tất cả các Khu vực AWS mà không phát sinh thêm chi phí. Để bắt đầu, hãy tạo cụm Valkey 8.2 bằng Bảng điều khiển quản lý AWS, Bộ phát triển phần mềm (SDK) AWS hoặc Giao diện dòng lệnh (CLI) AWS. Bạn cũng có thể sử dụng tính năng tìm kiếm theo véc-tơ trên các cụm hiện có bằng cách nâng cấp từ bất kỳ phiên bản Valkey hoặc Redis OSS nào lên Valkey 8.2 chỉ với vài cú nhấp chuột mà không mất thời gian ngừng hoạt động. Để tìm hiểu thêm về tính năng tìm kiếm theo véc-tơ của ElastiCache cho Valkey, hãy đọc blog này và xem danh sách các lệnh được hỗ trợ, hãy xem tài liệu ElastiCache.