Bases de connaissances pour Amazon Bedrock

Grâce aux bases de connaissances pour Amazon Bedrock, vous pouvez fournir aux FM et aux agents des informations contextuelles issues des sources de données privées de votre entreprise pour la RAG afin de donner des réponses plus pertinentes, plus précises et plus personnalisées.

Support entièrement géré pour un flux de travail RAG de bout en bout

Pour fournir aux modèles de fondation (FM) des informations exclusives et à jour, les organisations utilisent la génération augmentée de récupération (RAG), une technique qui permet d’extraire les données des sources de données de l’entreprise et d’enrichir les invites afin de générer des réponses plus pertinentes et plus précises. Les bases de connaissances pour Amazon Bedrock sont une fonctionnalité entièrement gérée qui vous aide à mettre en œuvre l'intégralité du flux de travail RAG, de l'ingestion à la récupération et à l'augmentation rapide, sans avoir à créer d'intégrations personnalisées aux sources de données et à gérer les flux de données. Vous pouvez également poser des questions et résumer les données d’un seul document, sans créer de base de données vectorielles. Vous pouvez aussi bénéficier de la gestion intégrée du contexte de session, de sorte que votre application peut facilement prendre en charge les conversations à plusieurs tours.

Une description formelle de la vue d'ensemble d'une base de connaissances

Connectez en toute sécurité les FM et les agents aux sources de données

Une fois que vous avez indiqué l’emplacement de vos données propriétaires, les bases de connaissances récupèrent automatiquement les documents. Vous pouvez ingérer du contenu depuis le Web et depuis des référentiels tels qu’Amazon Simple Storage Service (Amazon S3), Confluence (version préliminaire), Salesforce (version préliminaire) et SharePoint (version préliminaire). Une fois le contenu ingéré, les bases de connaissances le divisent en blocs de texte, convertissent le texte en intégrations et stockent les intégrations dans votre base de données vectorielles.
Les bases de connaissances gèrent également les complexités des flux de travail, telles que la comparaison de contenu, la gestion des défaillances, le contrôle du débit, le chiffrement, etc. Si vous ne possédez pas de base de données vectorielles existante, Amazon Bedrock crée pour vous un magasin vectoriel Amazon OpenSearch sans serveur. Vous pouvez également spécifier un magasin vectoriel existant dans l’une des bases de données prises en charge, notamment Amazon OpenSearch sans serveur, Pinecone ainsi que Redis Enterprise Cloud, Amazon Aurora et MongoDB.

écran pour créer une base de connaissances et configurer des sources de données

Personnalisez les bases de connaissances pour fournir des réponses précises au moment de l’exécution

Vous pouvez désormais affiner la récupération et l’ingestion pour obtenir une meilleure précision dans tous les cas d’utilisation. Tirez parti des options d’analyse avancées pour comprendre les données non structurées (par exemple, les PDF, les images numérisées) dont le contenu est complexe (par exemple, les tableaux). À l’aide d’options avancées de découpage des données, telles que le découpage personnalisé, vous pouvez écrire votre propre code de découpage en tant que fonction Lambda, et même utiliser des composants standard issus de cadres tels que LangChain et LlamaIndex. Si vous préférez, vous pouvez également utiliser l’une de nos stratégies de découpage intégrées, notamment les stratégies à taille fixe, sans découpage, à découpage hiérarchique, à découpage sémantique ou encore notre stratégie par défaut. Au moment de la récupération, utilisez la reformulation des requêtes pour améliorer la capacité du système à comprendre les requêtes complexes.

capture d’écran de la configuration d’analyse syntaxique Bedrock Chunking

Récupérez facilement les données pertinentes et augmentez les invites

Vous pouvez utiliser l'API Retrieve pour récupérer des résultats pertinents pour une requête utilisateur à partir de bases de connaissances. L'API RetrieveAndGenerate va encore plus loin en utilisant directement les résultats récupérés pour augmenter l'invite FM et renvoyer la réponse. Vous pouvez également ajouter des bases de connaissances aux agents pour Amazon Bedrock afin de fournir des informations contextuelles aux agents.

API de récupération et de génération

Fournir l'attribution de la source

Toutes les informations extraites des bases de connaissances pour Amazon Bedrock sont accompagnées de citations afin d'améliorer la transparence et de minimiser les hallucinations.

Une fenêtre de chat dans laquelle un utilisateur discute avec l'agent