Amazon Textract

Extraiga texto y datos con facilidad de prácticamente cualquier documento

Amazon Textract es un servicio que extrae automáticamente texto y datos de documentos escaneados. Amazon Textract no se limita al simple reconocimiento óptico de caracteres (OCR), sino que también identifica el contenido de campos de formularios e información almacenada en tablas.

Hoy en día, muchas compañías extraen datos de documentos y formularios mediante el ingreso manual de datos, lo cual es lento y costoso, o mediante un software de reconocimiento óptico de caracteres (OCR) que es difícil de personalizar. Las reglas y los flujos de trabajo para cada documento y formulario a menudo se deben codificar y actualizar con cada cambio que se realiza al formulario o cuando se trata de formularios múltiples. Si el formulario se aleja de las reglas, el resultado es, a menudo, desordenada e inutilizable.

Amazon Textract supera estos problemas con el aprendizaje automático para "leer" de manera instantánea prácticamente cualquier tipo de documento a fin de extraer texto y datos de forma precisa sin necesidad de cambios manuales ni utilizar código personalizado. Con Textract, puede automatizar rápidamente flujos de trabajo con documentos, lo que le permite procesar un millón de páginas en horas. Una vez que se captura la información, puede usarla dentro de las aplicaciones de su empresa para dar los próximos pasos y hacer una solicitud de préstamo o procesar reclamaciones médicas. Además, puede crear índices de búsqueda inteligente y flujos de trabajo de aprobación automatizados o mantener mejor la conformidad con las reglas de archivo de documentos al marcar los datos que pueden requerir una redacción.

Presentación de Amazon Textract

Beneficios

Extraer datos de forma rápida y precisa

Amazon Textract facilita la extracción rápida y precisa de datos de documentos y formularios. Amazon Textract detecta automáticamente el diseño de un documento y los elementos clave en la página, entiende las relaciones de datos en cualquier formulario o tabla integrados, y extrae todo con su contexto intacto. Esto significa que puede usar instantáneamente los datos extraídos en una aplicación o almacenarlos en una base de datos sin que haya mucho código complicado involucrado.



No es necesario mantener códigos ni plantillas

Los modelos de aprendizaje automático previamente entrenados de Amazon Textract eliminan la necesidad de escribir código para extraer datos, porque ya han sido entrenados con decenas de millones de documentos de prácticamente todos los sectores, incluso facturas, recibos, contratos, documentos fiscales, pedidos de ventas, formularios de inscripción, solicitudes de beneficios, reclamaciones de seguros, documentos de pólizas y muchos más. Ya no necesita mantener el código de cada documento o formulario que pueda recibir ni preocuparse por cómo cambian los diseños de página con el paso del tiempo.

Menores costos de procesamiento de documentos

La API de extracción de texto de Amazon Textract le permite procesar documentos por 1,50 USD cada 1000 páginas. Ya sea que procese unos cientos de documentos al año o millones, Amazon Textract ofrece OCR y extracción de datos estructurados (formularios y tablas) a un costo muy bajo, y solo paga por lo que usa. No requiere acuerdos iniciales ni contratos a largo plazo.

Casos de uso

Crear índices de búsqueda inteligente

Extraiga datos estructurados de documentos y cree un índice inteligente con Amazon Elasticsearch Service para poder buscar rápidamente en millones de estados financieros. Por ejemplo, una compañía de préstamo hipotecario podría usar Amazon Textract para procesar millones de solicitudes de préstamos escaneadas en cuestión de horas e indexar los datos extraídos en Amazon Elasticsearch. Esto les permitiría crear búsquedas como, p. ej., "búsqueda de solicitudes de préstamos donde el nombre del solicitante es John Doe" o "búsqueda de contratos donde la tasa de interés es del 2 %".

Cree flujos de trabajo de procesamiento de documentos automatizados

Amazon Textract puede proporcionar las entradas necesarias para procesar formularios automáticamente sin intervención humana. Por ejemplo, un banco podría escribir un código para leer los archivos PDF de las solicitudes de préstamo. La información que contiene el documento podría usarse para iniciar todos los antecedentes necesarios y las verificaciones de crédito para aprobar el préstamo, de modo que los clientes puedan obtener resultados instantáneos de su solicitud en lugar de tener que esperar varios días para la revisión y la validación manuales.

Mantener la conformidad en los archivos de documentos

Debido a que Amazon Textract identifica los tipos de datos y las etiquetas de los formularios de forma automática, es fácil mantener la conformidad con los controles de la información. Por ejemplo, una aseguradora podría usar Amazon Textract para alimentar un flujo de trabajo que redacta automáticamente la información de identificación personal (PII) a fin de revisarla antes de archivar los formularios de reclamación mediante el reconocimiento automático de los pares clave-valor importantes que requieren protección.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Conozca las características de Amazon Textract

Obtenga más información sobre cómo Amazon Textract detecta pares clave-valor, conserva los datos tabulares y mucho más.

Más información 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Inscríbase para obtener una cuenta gratuita

Obtenga acceso automáticamente a la capa gratuita de AWS. 

Inscribirse 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Inscríbase para solicitar la versión preliminar de Amazon Textract

Comience a crear con Amazon Textract registrándose para obtener acceso a la versión preliminar.

Inscribirse