Anúncio da pesquisa vetorial para o Amazon ElastiCache

Publicado: 13 de out de 2025

A pesquisa vetorial do Amazon ElastiCache agora está disponível ao público em geral. Agora, os clientes podem usar o ElastiCache para indexar, pesquisar e atualizar bilhões de incorporações vetoriais de alta dimensão de fornecedores populares como Amazon Bedrock, Amazon SageMaker, Anthropic e OpenAI com latência de até microssegundos e até 99% de recall.

Os principais casos de uso incluem cache semântico para grandes modelos de linguagem (LLMs) e agentes conversacionais de várias voltas, que reduzem significativamente a latência e o custo ao armazenar em cache consultas semanticamente semelhantes. A pesquisa vetorial do ElastiCache também potencializa os sistemas de IA agêntica com a geração aumentada via recuperação (RAG) para garantir resultados altamente relevantes e baixa latência consistente em várias etapas de recuperação. Os casos de uso adicionais incluem mecanismos de recomendação, detecção de anomalias e outras aplicações que exigem pesquisa eficiente em várias modalidades de dados.

A pesquisa vetorial do ElastiCache está disponível com a versão 8.2 do Valkey em clusters baseados em nós em todas as regiões da AWS sem custo adicional. Para começar a usá-la, crie um cluster do Valkey 8.2 usando o Console de Gerenciamento da AWS, o AWS Software Development Kit (AWS SDK) ou a AWS Command Line Interface (AWS CLI). Você também pode usar a pesquisa vetorial em seus clusters existentes atualizando de qualquer versão do Valkey ou Redis OSS para o Valkey 8.2 com apenas alguns cliques, sem tempo de inatividade. Para saber mais sobre a pesquisa vetorial do ElastiCache para Valkey, leia este blog e, para obter uma lista de comandos com suporte, consulte a documentação do ElastiCache