À quoi sert cette solution AWS ?
La solution Document Understanding (DUS) est une application web facile à utiliser qui permet d'ingérer et d'analyser des fichiers, d'extraire du texte de documents, d'identifier des données structurelles (tables, paires clé/valeur), d'extraire des informations essentielles (entités) et de créer des index de recherche intelligents à partir des données. De plus, les fichiers peuvent y être chargés directement, et il est possible d'accéder aux fichiers analysés depuis un compartiment Amazon Simple Storage Service (Amazon S3) dans votre compte AWS.
Cette solution utilise les services d'intelligence artificielle AWS (IA) qui répondent à des problèmes commerciaux qui s'appliquent à divers marchés verticaux du secteur :
- Recherche et découverte : recherche d'informations dans plusieurs documents numérisés, PDF et images
- Conformité : suppression des informations contenues dans les documents
- Automatisation des flux de travail : s'intègre facilement à vos applications existantes, en amont et en aval
Présentation de la solution AWS
Le diagramme ci-dessous présente l'architecture que vous pouvez déployer automatiquement à l'aide du guide d'implémentation de la solution et du modèle AWS CloudFormation fourni.

Architecture de la solution Document Understanding
Le modèle AWS CloudFormation déploie une application web statique hébergée dans un compartiment Simple Storage Service (Amazon S3) et fournie par une distribution Amazon CloudFront. Les utilisateurs sont authentifiés à l'aide d'Amazon Cognito. L'application web interagit avec le backend en utilisant une API Amazon API Gateway prise en charge par une fonction AWS Lambda. Les documents sont téléchargés soit à l'aide de l'application Web, soit directement dans un compartiment Amazon S3 dédié pour un traitement en masse. Le traitement des documents est lancé par l'API, qui déclenche une fonction Lambda pour ajouter une entrée à une table Amazon DynamoDB. La table déclenche une deuxième fonction Lambda qui supervise le traitement. Le format de fichier du chargement indique le chemin du traitement. Amazon Textract extrait le texte et les informations structurelles des fichiers. Le texte extrait est ensuite envoyé à Amazon Comprehend et Amazon Comprehend Medical pour analyse plus approfondie.
Les analyses qui en résultent sont stockées dans un compartiment Simple Storage Service (Amazon S3) tandis que les métadonnées sont stockées dans une base de données DynamoDB. Les informations extraites sont utilisées pour indexer le document dans Amazon OpenSearch Service et dans Amazon Kendra, si Kendra est activé.
Solution Document understanding
Version 1.0.3
Date de publication : 11/2021
Auteur : AWS
Temps de déploiement estimé : 30-60 min
Ressources supplémentaires
Télécharger le guide d'implémentationFonctions
Rechercher et découverte
Exploiter les services IA (Intelligence artificielle) AWS
Conformité

Parcourez notre bibliothèque des implémentations des solutions AWS pour obtenir des réponses aux problèmes d'architecture courants.

Trouvez des partenaires consultants et technologiques certifiés AWS pour vous aider à commencer.

Parcourez notre portefeuille d'offres de conseil pour obtenir une aide approuvée AWS au déploiement de solutions.