La récupération multimodale des bases de connaissances pour Bedrock est désormais disponible pour tous
AWS annonce aujourd'hui la disponibilité générale de la récupération multimodale dans les bases de connaissances pour Bedrock. Les bases de connaissances pour Amazon Bedrock proposent des flux de travail de génération à enrichissement contextuel (RAG) entièrement gérés de bout en bout pour créer des applications d’IA générative extrêmement précises, à faible latence et personnalisées en incorporant des informations contextuelles provenant des sources de données de votre entreprise. La prise en charge de la recherche multimodale dans les bases de connaissances permet aux développeurs de créer des applications de recherche et de réponse aux questions optimisées par l'IA, qui fonctionnent sur du texte, des images, des fichiers audio et vidéo. Par exemple, un utilisateur peut demander à son assistant de lui montrer les projections du premier trimestre pour Amazon Bedrock, et les bases de connaissances pour Bedrock récupéreront le texte pertinent à partir de documents, de graphiques, d’audio et d’extraits vidéo liés aux prévisions de revenus pour Bedrock, ce qui permettra à l'assistant de générer des réponses plus riches et plus complètes pour l'utilisateur final. Auparavant, les clients ne pouvaient effectuer des recherches que dans des documents texte et des images. Ils peuvent désormais accéder à des informations provenant de tous les formats de données de leur entreprise grâce à un flux de travail unifié et entièrement géré.
Les entreprises ont du mal à extraire des informations de leurs données multimédia croissantes (vidéos, enregistrements audio, images et documents), car la création d'applications d'IA capables de rechercher selon ces différentes modalités est complexe. Par conséquent, les informations précieuses contenues dans des téraoctets d'enregistrements de réunions, de vidéos de formation et de documentation visuelle restent inaccessibles, ce qui empêche les organisations de prendre des décisions basées sur des données rapidement et avec précision. Grâce à la récupération multimodale pour les bases de connaissances, les développeurs peuvent ingérer du contenu multimodal avec un contrôle total des options d'analyse, de découpage, de vectorisation (p. ex. Amazon Nova multimodal) et de stockage vectoriel. À partir de là, ils peuvent ensuite envoyer une requête textuelle ou une image en entrée et récupérer des segments de texte, d'image, audio et vidéo pertinents afin de générer une réponse dans leurs applications d'IA générative en utilisant le LLM de leur choix.
Pour en savoir plus sur la création de bases de connaissances multimodales dans Bedrock, veuillez consulter la documentation. La disponibilité des régions dépend des caractéristiques sélectionnées pour la prise en charge multimodale. Consultez la documentation pour en savoir plus.