¿Qué hace esta solución de AWS?
La solución para la comprensión de documentos (DUS) ofrece una aplicación web fácil de usar que incorpora y analiza archivos, extrae texto de documentos, identifica datos estructurales (tablas, pares clave-valor), extrae información crítica (entidades) y crea índices de búsqueda inteligente a partir de los datos. Además, los archivos se pueden cargar directamente y es posible acceder a aquellos que han sido analizados desde un bucket de Amazon Simple Storage Service (Amazon S3) en su cuenta de AWS.
Esta solución utiliza los servicios de inteligencia artificial de AWS (IA) que abordan problemas empresariales que se aplican a diversos mercados verticales:
- Búsqueda y detección: busque información en diferentes tipos de documentos escaneados, PDF e imágenes
- Conformidad: edite los documentos de modo que no aparezca información confidencial
- Automatización del flujo de trabajo: se complementa con facilidad a las aplicaciones anteriores y posteriores
Información general sobre la solución de AWS
En el siguiente diagrama se muestra la arquitectura que puede implementar automáticamente con la guía de implementación de la solución y la plantilla de AWS CloudFormation correspondiente.

Arquitectura de la solución para la comprensión de documentos
La plantilla de AWS CloudFormation implementa una aplicación web estática alojada en un bucket de Amazon S3 y que funciona con una distribución de Amazon CloudFront. Los usuarios se autentican mediante Amazon Cognito. La aplicación web interactúa con el backend mediante una API de Amazon API Gateway, basada en una función de AWS Lambda. Los documentos se cargan a través de la aplicación web, o directamente en un bucket de Amazon S3 dedicado para el procesamiento por lotes. El procesamiento del documento se inicia por la API, que desencadena una función de Lambda para que agregue una entrada a una tabla de Amazon DynamoDB. La tabla desencadena una segunda función de Lambda que supervisa el procesamiento. La ruta del procesamiento se define según el formato del archivo cargado. Amazon Textract extrae el texto y la información estructural de los archivos. Tras ello, el texto extraído se traslada a Amazon Comprehend y Amazon Comprehend Medical para realizar análisis adicionales.
Los resultados de los análisis se almacenan en un bucket de Amazon S3 y los metadatos se almacenan en una base de datos de DynamoDB. La información extraída se utiliza para indexar el documento en Amazon OpenSearch Service y, si está habilitado, en Amazon Kendra.
Solución para la comprensión de documentos
Versión 1.0.3
Fecha de lanzamiento: 11/2021
Autor: AWS
Tiempo estimado de implementación: 30-60 minutos
Recursos adicionales
Descargar guía de implementaciónCaracterísticas
Búsqueda y detección
Aproveche los servicios de IA de AWS
Conformidad

Consulte nuestra biblioteca de Implementaciones de soluciones de AWS para obtener respuestas a problemas de arquitectura comunes.

Encuentre socios consultores y tecnológicos certificados por AWS que lo ayudarán a comenzar.

Explore nuestra cartera de ofertas de asesoramiento para obtener ayuda autorizada por AWS con la implementación de la solución.