¿Qué hace esta solución de AWS?
La solución para la comprensión de documentos ofrece una aplicación web fácil de usar que incorpora y analiza archivos, extrae texto de los documentos, identifica datos estructurales (tablas, pares clave-valor), extrae información crítica (entidades) y crea índices de búsqueda inteligente a partir de los datos. Además, los archivos se pueden cargar directamente y es posible acceder a aquellos que han sido analizados desde un bucket de Amazon Simple Storage Service (Amazon S3) en su cuenta de AWS.
Esta solución utiliza los servicios de inteligencia artificial (IA) de AWS que abordan problemas empresariales que se aplican a diversos mercados verticales:
- Búsqueda y detección: busque información en diferentes tipos de documentos escaneados, PDF e imágenes
- Conformidad: edite los documentos de modo que no aparezca información confidencial
- Automatización del flujo de trabajo: se complementa con facilidad a las aplicaciones anteriores y posteriores
Información general sobre la solución de AWS
En el siguiente diagrama se muestra la arquitectura que puede implementar automáticamente con la guía de implementación de la solución y la plantilla de AWS CloudFormation correspondiente.

Arquitectura de la solución para la comprensión de documentos
La plantilla de AWS CloudFormation implementa una aplicación web estática alojada en un bucket de Amazon S3 y que funciona con una distribución de Amazon CloudFront. Los usuarios se autentican mediante Amazon Cognito. La aplicación web interactúa con el backend mediante una API de Amazon API Gateway, basada en una función de AWS Lambda. Los documentos se cargan a través de la aplicación web, o directamente en un bucket de Amazon S3 dedicado para el procesamiento por lotes. La API comienza el procesamiento de los documentos e inicia así una función de Lambda para agregar una entrada a una tabla de Amazon DynamoDB. La tabla inicia una segunda función de Lambda que supervisa el procesamiento. La ruta del procesamiento se define según el formato del archivo cargado. Amazon Textract extrae el texto y la información estructural de los archivos. Tras ello, el texto extraído se traslada a Amazon Comprehend y Amazon Comprehend Medical para realizar análisis adicionales.
Los resultados de los análisis se almacenan en un bucket de Amazon S3 y los metadatos se almacenan en una base de datos de DynamoDB. La información extraída se utiliza para indexar el documento en Amazon OpenSearch Service y, si está activado, en Amazon Kendra.
Solución para la comprensión de documentos
Versión 1.0.5
Fecha de lanzamiento: 09/2022
Autor: AWS
Tiempo estimado de implementación: 30-60 minutos
Recursos adicionales
Descargar guía de implementaciónCaracterísticas
Búsqueda y detección
Aproveche los servicios de IA de AWS
Conformidad

Revise nuestra biblioteca de soluciones de AWS para obtener respuestas a problemas de arquitectura comunes.

Encuentre socios de AWS que lo ayuden a comenzar.

Encuentre diagramas de arquitectura prescriptivos, código de muestra y contenido técnico para casos de uso comunes.