Introduzione della ricerca vettoriale per Amazon ElastiCache

Inserito il: 13 ott 2025

La ricerca vettoriale per Amazon ElastiCache è ora disponibile al pubblico. I clienti possono ora utilizzare ElastiCache per indicizzare, cercare e aggiornare miliardi di embedding vettoriali di grande dimensione di provider popolari come Amazon Bedrock, Amazon SageMaker, Anthropic e OpenAI con una latenza di soli microsecondi e un richiamo fino al 99%.

I casi d'uso principali includono il caching semantico per modelli linguistici di grandi dimensioni (LLM) e agenti conversazionali multi-turno, che riducono significativamente latenza e costi mediante la memorizzazione in cache di query semanticamente simili. La ricerca vettoriale per ElastiCache alimenta anche i sistemi di IA agentici con generazione potenziata da recupero dati (RAG) per garantire risultati altamente pertinenti e una latenza costantemente bassa in più fasi di recupero. Altri casi d'uso includono motori di raccomandazione, rilevamento di anomalie e altre applicazioni che richiedono ricerche efficienti attraverso multiple modalità di dati.

La ricerca vettoriale per ElastiCache è disponibile con la versione 8.2 di Valkey su cluster basati su nodi in tutte le regioni AWS senza costi aggiuntivi. Per iniziare, crea un cluster Valkey 8.2 utilizzando la console di gestione AWS, il Software Development Kit (SDK) o l'interfaccia a riga di comando (CLI) di AWS. È anche utilizzare la ricerca vettoriale sui propri cluster esistenti eseguendo l'upgrade da qualsiasi versione di Valkey o Redis OSS a Valkey 8.2 in pochi clic e senza tempi di inattività. Per maggiori informazioni sulla ricerca vettoriale per ElastiCache per Valkey leggi questo blog, mentre per una lista dei comandi supportati consulta la documentazione di ElastiCache