Solución para la comprensión de documentos

¿Qué hace esta solución de AWS?

La solución para la comprensión de documentos ofrece una aplicación web fácil de usar que incorpora y analiza archivos, extrae texto de los documentos, identifica datos estructurales (tablas, pares clave-valor), extrae información crítica (entidades) y crea índices de búsqueda inteligente a partir de los datos. Además, los archivos se pueden cargar directamente y es posible acceder a aquellos que han sido analizados desde un bucket de Amazon Simple Storage Service (Amazon S3) en su cuenta de AWS.

Esta solución utiliza los servicios de inteligencia artificial (IA) de AWS que abordan problemas empresariales que se aplican a diversos mercados verticales:

  • Búsqueda y detección: busque información en diferentes tipos de documentos escaneados, PDF e imágenes
  • Conformidad: edite los documentos de modo que no aparezca información confidencial
  • Automatización del flujo de trabajo: se complementa con facilidad a las aplicaciones anteriores y posteriores 

 

Información general sobre la solución de AWS

En el siguiente diagrama se muestra la arquitectura que puede implementar automáticamente con la guía de implementación de la solución y la plantilla de AWS CloudFormation correspondiente.

Arquitectura de la solución para la comprensión de documentos

La plantilla de AWS CloudFormation implementa una aplicación web estática alojada en un bucket de Amazon S3 y que funciona con una distribución de Amazon CloudFront. Los usuarios se autentican mediante Amazon Cognito. La aplicación web interactúa con el backend mediante una API de Amazon API Gateway, basada en una función de AWS Lambda. Los documentos se cargan a través de la aplicación web, o directamente en un bucket de Amazon S3 dedicado para el procesamiento por lotes. La API comienza el procesamiento de los documentos e inicia así una función de Lambda para agregar una entrada a una tabla de Amazon DynamoDB. La tabla inicia una segunda función de Lambda que supervisa el procesamiento. La ruta del procesamiento se define según el formato del archivo cargado. Amazon Textract extrae el texto y la información estructural de los archivos. Tras ello, el texto extraído se traslada a Amazon Comprehend y Amazon Comprehend Medical para realizar análisis adicionales.

Los resultados de los análisis se almacenan en un bucket de Amazon S3 y los metadatos se almacenan en una base de datos de DynamoDB. La información extraída se utiliza para indexar el documento en Amazon OpenSearch Service y, si está activado, en Amazon Kendra.

Solución para la comprensión de documentos

Versión 1.0.5
Fecha de lanzamiento: 09/2022
Autor: AWS

Tiempo estimado de implementación: 30-60 minutos

Costo estimado  Código fuente  Plantilla de CloudFormation 
Use el siguiente botón para suscribirse para recibir actualizaciones sobre esta implementación de soluciones.
Nota: Para suscribirse a las actualizaciones de RSS, debe disponer de un complemento de RSS habilitado para el navegador que utilice.
¿Le ayudó esta implementación de soluciones?
Proporcione su opinión 

Características

Búsqueda y detección

Busque información en diferentes tipos de documentos escaneados, PDF e imágenes.

Aproveche los servicios de IA de AWS

Utilice Amazon Textract para extraer texto e información estructural de los archivos, para luego enviarlos a Amazon Comprehend y Amazon Comprehend Medical para realizar un análisis profundo.

Conformidad

Edite los documentos de modo que no aparezca información confidencial.
Icono de creación
Implemente una solución de AWS por su cuenta

Revise nuestra biblioteca de soluciones de AWS para obtener respuestas a problemas de arquitectura comunes.

Más información 
Buscar un socio de APN
Buscar una solución de un socio de AWS

Encuentre socios de AWS que lo ayuden a comenzar.

Más información 
Icono de exploración
Explorar orientación

Encuentre diagramas de arquitectura prescriptivos, código de muestra y contenido técnico para casos de uso comunes.

Más información