Amazon Textract

Extraiga texto y datos con facilidad de prácticamente cualquier documento
Amazon Textract es un servicio de aprendizaje automático completamente administrado que extrae automáticamente texto y datos de documentos escaneados. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas.

En la actualidad, muchas empresas extraen datos de documentos escaneados, como archivos PDF, tablas y formularios, a través de la entrada manual de datos (que es lenta, costosa y propensa a errores), o mediante un software simple de OCR que requiere una configuración manual que debe actualizarse cada vez que cambia el formulario para que sea utilizable.
 
Para superar estos procesos manuales, Textract utiliza el aprendizaje automático para leer y procesar instantáneamente cualquier tipo de documento y extrae con precisión texto, formularios, tablas y otros datos sin la necesidad de ningún trabajo manual o código personalizado.

Con Textract, puede automatizar rápidamente las actividades manuales de documentos, lo que le permite procesar millones de páginas de documentos en horas. Una vez que se obtiene la información, puede tomar medidas al respecto dentro de las aplicaciones de su negocio para iniciar los siguientes pasos para una solicitud de préstamo, documento fiscal, formulario de inscripción o procesamiento de reclamos médicos. Además, puede crear índices de búsqueda inteligentes o agregar revisiones humanas con Amazon Augmented AI con el objetivo de revisar datos variados o confidenciales.

Beneficios

Extraiga datos estructurados y no estructurados de forma rápida y precisa

Amazon Textract utiliza inteligencia artificial para “leer” documentos como lo haría una persona y extrae no solo texto sino también tablas, formularios y otros datos estructurados sin configuración, entrenamiento ni códigos personalizados. Amazon Textract detecta automáticamente el diseño de un documento y los elementos clave en la página, entiende las relaciones entre datos en cualquier formulario o tabla integrado y extrae todo con su contexto intacto.

Vaya más allá del simple reconocimiento óptico de caracteres (OCR)

Amazon Textract utiliza la tecnología de OCR para identificar etiquetas y valores de formularios, y extrae información de las tablas sin comprometer la estructura a un bajo costo. Solo paga por lo que usa y no hay compromisos iniciales ni contratos a largo plazo. 

Seguridad y conformidad

Textract se puede usar para cargas de trabajo que deban cumplir con los Controles de Organizaciones de Servicio (SOC), la Organización Internacional de Normalización (ISO), PCI, HIPAA y GPDR. Los clientes de los sectores de finanzas, atención sanitaria y otras industrias pueden obtener información de los procesos y controles de seguridad que protegen los datos de sus clientes. Textract también admite puntos de enlace de Amazon Virtual Private Cloud (Amazon VPC) a través de AWS PrivateLink que permite que los clientes inicien de manera segura llamadas de API a Amazon Textract desde dentro de su VPC y eviten usar la internet pública.

Implemente fácilmente revisiones hechas por humanos

Amazon Textract está directamente integrado con Amazon Augmented AI (Amazon A2I) para que pueda implementar fácilmente las revisiones hechas por humanos del texto extraído de los documentos. Puede integrar revisiones humanas para administrar flujos de trabajo confidenciales o exigentes que requieran del criterio humano para lograr predicciones de alta fiabilidad, o para auditar predicciones de forma habitual.

What is Amazon Textract (1:49)

Casos de uso

Crear índices de búsqueda inteligente

Extraiga datos estructurados de documentos y cree un índice inteligente para poder buscar rápidamente en millones de estados financieros. Por ejemplo, una compañía de préstamo hipotecario podría usar Amazon Textract para procesar millones de solicitudes de préstamos escaneadas en cuestión de horas e indexar los datos extraídos en Amazon Elasticsearch. Esto les permitiría crear búsquedas como, p. ej., “búsqueda de solicitudes de préstamos donde el nombre del solicitante es John Doe” o “búsqueda de contratos donde la tasa de interés es del 2 %”.

Cree flujos de trabajo de procesamiento de documentos automatizados

Amazon Textract puede proporcionar las entradas necesarias para procesar formularios automáticamente sin intervención humana. Por ejemplo, los bancos pueden automatizar las solicitudes de préstamos con Amazon Textract. La información que contiene el documento podría usarse para iniciar todos los antecedentes necesarios y las verificaciones de crédito para aprobar el préstamo, de modo que los clientes puedan obtener resultados instantáneos de su solicitud en lugar de tener que esperar varios días para la revisión y la validación manuales.

Mantener la conformidad en los archivos de documentos

Debido a que Amazon Textract identifica los tipos de datos y las etiquetas de los formularios de forma automática, es fácil mantener la conformidad con los controles de la información. Por ejemplo, una aseguradora podría usar Amazon Textract para alimentar un flujo de trabajo que redacta automáticamente la información de identificación personal (PII) a fin de revisarla antes de archivar los formularios de reclamación, mediante el reconocimiento automático de los pares clave-valor importantes que requieren protección.

Historias de éxito de los clientes

machine leanring_kabbage logo

Kabbage es una empresa de datos y tecnología que proporciona soluciones de flujo de efectivo para pequeñas empresas, incluido acceso a líneas de crédito flexibles, pagos en línea, información de flujo de efectivo y cuentas corrientes empresariales.

“Amazon Textract nos ayudó a respaldar al 80 % de los postulantes de PPP para que reciban una experiencia de préstamo completamente automatizada y redujo los tiempos de aprobación de varios días a una velocidad mediante de 4 horas. Para fines del programa, nos convertimos en la segunda entidad crediticia de PPP más grande de la nación por volumen de solicitudes, superando a los principales bancos de EE. UU., ya que prestamos servicios a más de 297 000 pequeñas empresas y preservamos aproximadamente 945 000 trabajos en todo el país”.

Anthony Sabelli, director de ciencia de datos de Kabbage



change-healthcare-600x400

Change Healthcare es una compañía líder en tecnología de atención médica independiente que brinda soluciones basadas en datos y análisis para mejorar los resultados clínicos, financieros y de participación del paciente en el sistema de atención médica de EE. UU.

“En Change Healthcare, creemos que podemos hacer que la atención médica sea asequible y accesible para todos con la mejora de la puntualidad y la calidad de las decisiones financieras y administrativas. Esto se puede lograr mediante el poder de la tecnología de aprendizaje automático para comprender mejor nuestros datos. Pero, desbloquear el potencial de esta información, a menudo, puede ser difícil, ya que está almacenada en tablas y formas que el reconocimiento óptico de caracteres tradicional no ha podido analizar. Amazon Textract mejora aún más la comprensión de los documentos gracias a la capacidad de recuperar datos estructurados además del texto, y ahora que el servicio cumple con la ley HIPAA, podremos liberar la información de millones de documentos y crear aún más valor para los pacientes, los pagadores y los proveedores”.

Nick Giannasi, vicepresidente ejecutivo y director general de Inteligencia Artificial de Change Healthcare


filevine-600x400

Filevine es el núcleo operativo para profesionales legales, incluidos gestión de problemas y casos basados en la nube, gestión de documentos y análisis de informes profundos. Desde su lanzamiento en 2015, Filevine se centró en la innovación rápida y el diseño galardonado, lo que redituó en las mayores clasificaciones de parte de sitios de reseña independientes.

“Todos los días, se presentan millones de archivos de problemas y casos en Filevine. Elegimos Amazon Web Services porque queremos ofrecer las mejores soluciones de búsqueda de documentos de su clase para nuestros clientes. Amazon Textract es rápido, preciso y escalable: ayuda a Filevine a reunir los requisitos rigurosos de las organizaciones jurídicas más grandes y sofisticadas del mundo. Con Filevine y Amazon, encontrar la proverbial aguja en el pajar es más fácil que nunca para los profesionales jurídicos”.

Ryan Anderson, director general ejecutivo de Filevine


Product-Page_Standard-Icons_01_Product-Features_SqInk
Conozca las características de Amazon Textract

Descubra más características de Amazon Textract.

Más información 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comience a crear en la consola

Comience a crear con Amazon Textract en la consola de administración de AWS.

Regístrese