Anuncio de la búsqueda vectorial para Amazon ElastiCache
La búsqueda vectorial de Amazon ElastiCache ya está disponible de forma general. Ahora, los clientes pueden usar Amazon ElastiCache para indexar, buscar y actualizar miles de millones de incrustaciones vectoriales de alta dimensión de proveedores populares como Amazon Bedrock, Amazon SageMaker, Anthropic y OpenAI, con una latencia de tan solo microsegundos y una recuperación de hasta el 99 %.
Los casos de uso clave incluyen el almacenamiento en caché semántico para los modelos de lenguaje de gran tamaño (LLM) y los agentes conversacionales de varios turnos, lo cual reduce significativamente la latencia y el costo al almacenar en caché consultas similares a nivel semántico. La búsqueda vectorial para ElastiCache también potencia los sistemas de IA agéntica con la generación aumentada por recuperación (RAG) para garantizar resultados altamente relevantes y una latencia baja y constante en varios pasos de recuperación. Los casos de uso adicionales incluyen motores de recomendación, detección de anomalías y otras aplicaciones que requieren una búsqueda eficiente en múltiples modalidades de datos.
La búsqueda vectorial para ElastiCache está disponible con la versión 8.2 de Valkey en clústeres basados en nodos en todas las regiones de AWS sin costo adicional. Para empezar, cree un clúster de Valkey 8.2 con la Consola de administración de AWS, el kit de desarrollo de software (SDK) de AWS o la interfaz de la línea de comandos (CLI) de AWS. También puede utilizar la búsqueda vectorial en sus clústeres existentes actualizando cualquier versión de Valkey o Redis OSS a Valkey 8.2 con unos pocos clics y sin tiempo de inactividad. Para obtener más información sobre la búsqueda vectorial de ElastiCache para Valkey, lea este blog y, para obtener una lista de los comandos compatibles, consulte la documentación de ElastiCache.