Recuperação multimodal para Bedrock Knowledge Bases agora geralmente disponíveis
Hoje, a AWS anuncia a disponibilidade geral da recuperação multimodal nas bases de conhecimento da Bedrock. As Bases de Conhecimento para Amazon Bedrock oferecem fluxos de trabalho de geração aumentada via recuperação (RAG) completos e totalmente gerenciados para criar aplicações de IA generativa altamente precisas, de baixa latência e personalizadas por meio da incorporação de informações contextuais das fontes de dados da empresa. A recuperação multimodal em Bases de Conhecimento permite que os desenvolvedores criem aplicações de pesquisa e resposta a perguntas baseadas em IA que funcionam com arquivos de texto, imagens, áudio e vídeo. Por exemplo, um usuário pode pedir ao assistente “mostre-me as projeções do primeiro trimestre para o Amazon Bedrock” e as bases de conhecimento da Bedrock recuperarão textos relevantes de documentos, gráficos, trechos de vídeo e áudio relacionados às projeções de receita da Bedrock, permitindo que o assistente gere respostas mais completas e completas para o usuário final. Anteriormente, os clientes só podiam pesquisar documentos de texto e imagens. Agora, eles podem obter insights de todos os formatos de dados corporativos por meio de um fluxo de trabalho unificado e totalmente gerenciado.
As organizações lutam para extrair insights de seus crescentes dados multimídia:vídeos, gravações de áudio, imagens e documentos, porque criar aplicativos de IA que possam pesquisar nessas diferentes modalidades é complexo. Como resultado, informações valiosas presas em terabytes de gravações de reuniões, vídeos de treinamento e documentação visual permanecem inacessíveis, impedindo que as organizações tomem decisões baseadas em dados com rapidez e precisão. Com a recuperação multimodal para bases de conhecimento, os desenvolvedores podem ingerir conteúdo multimodal com controle total das opções de análise, fragmentação, incorporação (por exemplo, Amazon Nova multimodal) e armazenamento vetorial. A partir daí, eles podem enviar uma consulta de texto ou uma imagem como entrada e recuperar segmentos relevantes de texto, imagem, áudio e vídeo para gerar uma resposta em seus aplicativos generativos de IA usando o LLM de sua escolha.
Para obter mais informações sobre a criação de bases de conhecimento multimodais no Bedrock, consulte a documentação. A disponibilidade da região depende dos recursos selecionados para suporte multimodal. Consulte a documentação para obter detalhes.