Amazon Textract

Extraiga texto y datos con facilidad de prácticamente cualquier documento
Amazon Textract es un servicio que extrae automáticamente texto y datos de documentos escaneados. Amazon Textract no se limita al simple reconocimiento óptico de caracteres (OCR), sino que también identifica el contenido de campos en formularios e información almacenada en tablas.

Hoy en día, muchas compañías extraen datos de documentos y formularios mediante el ingreso manual de datos, lo cual es lento y costoso; o mediante un software de reconocimiento óptico de caracteres (OCR) que requiere personalización o configuración manual. Las reglas y los flujos de trabajo para cada documento y formulario a menudo se deben preprogramar y actualizar con cada cambio que se realiza al formulario o cuando se trata de formularios múltiples. Si el formulario se aleja de las reglas, el resultado es, a menudo, desordenada e inutilizable.

Amazon Textract supera estos problemas con el aprendizaje automático para "leer" de manera instantánea prácticamente cualquier tipo de documento a fin de extraer texto y datos de forma precisa sin necesidad de cambios manuales ni utilizar código personalizado. Con Textract, puede automatizar rápidamente flujos de trabajo con documentos, lo que le permite procesar un millón de páginas en horas. Una vez que se captura la información, puede usarla dentro de las aplicaciones de su empresa para dar los próximos pasos y hacer una solicitud de préstamo o procesar reclamaciones médicas. Además, puede crear índices de búsqueda inteligente y flujos de trabajo de aprobación automatizados o mantener mejor la conformidad con las reglas de archivo de documentos si marca los datos que pueden requerir una redacción.

Presentación de Amazon Textract (3:04)

Beneficios

Extraer datos de forma rápida y precisa

Amazon Textract facilita la extracción rápida y precisa de datos de documentos, formularios y tablas. Amazon Textract detecta automáticamente el diseño de un documento y los elementos clave en la página, entiende las relaciones entre datos en cualquier formulario o tabla integrado, y extrae todo con su contexto intacto. Esto significa que puede usar instantáneamente los datos extraídos en una aplicación o almacenarlos en una base de datos sin que haya mucho código complicado involucrado.



No es necesario mantener códigos ni plantillas

Los modelos de aprendizaje automático previamente entrenados de Amazon Textract eliminan la necesidad de escribir código para extraer datos, porque ya se han entrenado con decenas de millones de documentos de prácticamente todos los sectores, incluso contratos, documentos fiscales, pedidos de ventas, formularios de inscripción, solicitudes de beneficios, reclamaciones de seguros, documentos de pólizas y muchos más. Ya no necesita mantener el código de cada documento o formulario que pueda recibir ni preocuparse por cómo cambian los diseños de página con el paso del tiempo.

Menores costos de procesamiento de documentos

Amazon Textract ofrece OCR y la extracción de datos estructurados (formularios y tablas) a un costo muy bajo, y solo paga por lo que usa. No requiere acuerdos iniciales ni contratos a largo plazo. Puede procesar fácilmente millones de documentos con las API de extracción de texto de Amazon Textract.

Casos de uso

Crear índices de búsqueda inteligente

Extraiga datos estructurados de documentos y cree un índice inteligente para poder buscar rápidamente en millones de estados financieros. Por ejemplo, una compañía de préstamo hipotecario podría usar Amazon Textract para procesar millones de solicitudes de préstamos escaneadas en cuestión de horas e indexar los datos extraídos en Amazon Elasticsearch. Esto les permitiría crear búsquedas como, p. ej., "búsqueda de solicitudes de préstamos donde el nombre del solicitante es John Doe" o "búsqueda de contratos donde la tasa de interés es del 2 %".

Cree flujos de trabajo de procesamiento de documentos automatizados

Amazon Textract puede proporcionar las entradas necesarias para procesar formularios automáticamente sin intervención humana. Por ejemplo, los bancos pueden automatizar las solicitudes de préstamos con Amazon Textract. La información que contiene el documento podría usarse para iniciar todos los antecedentes necesarios y las verificaciones de crédito para aprobar el préstamo, de modo que los clientes puedan obtener resultados instantáneos de su solicitud en lugar de tener que esperar varios días para la revisión y la validación manuales.

Mantener la conformidad en los archivos de documentos

Debido a que Amazon Textract identifica los tipos de datos y las etiquetas de los formularios de forma automática, es fácil mantener la conformidad con los controles de la información. Por ejemplo, una aseguradora podría usar Amazon Textract para alimentar un flujo de trabajo que redacta automáticamente la información de identificación personal (PII) a fin de revisarla antes de archivar los formularios de reclamación, mediante el reconocimiento automático de los pares clave-valor importantes que requieren protección.

Historias de éxito de los clientes

600x400-cambia-health-solutions_logo

Cambia Health Solutions es una compañía de soluciones de salud total y la compañía matriz de seis planes de salud regionales, incluida Regence, una aseguradora que presta servicios a 2,6 millones de miembros en Oregón, Idaho, Utah y Washington.

“En los últimos 100 años, Cambia se ha dedicado a mejorar la atención médica para las personas y sus familias. Para ayudarnos a lograr ese objetivo, siempre evaluamos nuevas innovaciones y oportunidades para optimizar la coordinación de la atención. Una de las áreas de interés es la optimización de los procesos administrativos que requieren mucho tiempo y trabajo. Estamos encantados de explorar Amazon Textract para ayudarnos a automatizar el proceso de extracción de datos valiosos de formularios en papel, de forma precisa y eficiente. La poderosa combinación de ciencia de datos, IA y un enfoque centrado en la persona es clave para nuestra misión de transformar el sistema de atención médica”.

Faraz Shafiq, director de Inteligencia Artificial de Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare es una compañía líder en tecnología de atención médica independiente que brinda soluciones basadas en datos y análisis para mejorar los resultados clínicos, financieros y de participación del paciente en el sistema de atención médica de EE. UU.

“En Change Healthcare, creemos que podemos hacer que la atención médica sea asequible y accesible para todos con la mejora de la puntualidad y la calidad de las decisiones financieras y administrativas. Esto se puede lograr mediante el poder de la tecnología de aprendizaje automático para comprender mejor nuestros datos. Pero, desbloquear el potencial de esta información, a menudo, puede ser difícil, ya que está almacenada en tablas y formas que el reconocimiento óptico de caracteres tradicional no ha podido analizar. Amazon Textract mejora aún más la comprensión de los documentos gracias a la capacidad de recuperar datos estructurados además del texto, y ahora que el servicio cumple con la ley HIPAA, podremos liberar la información de millones de documentos y crear aún más valor para los pacientes, los pagadores y los proveedores”.

Nick Giannasi, vicepresidente ejecutivo y director general de Inteligencia Artificial de Change Healthcare


CD_2018_Primary_Logo_w_TM

La innovadora plataforma de soluciones y servicios de ClearDATA protege a los clientes de los riesgos de privacidad de datos, mejora su gestión de datos y escala su infraestructura de TI de atención médica. Esto permite a la industria centrarse en mejorar la atención médica al progresar en la prestación de atención médica todos los días.

“Es emocionante ver a AWS agregar su servicio de reconocimiento óptico de caracteres con tecnología de aprendizaje automático, Textract, a su lista de servicios elegibles de HIPAA. Una gran cantidad de datos médicos que se comparte entre los pagadores y los proveedores están encerrados en archivos basados en imágenes como PDF. En lugar de procesar manualmente ese tipo de datos, las organizaciones de atención médica ahora pueden usar el servicio Amazon Textract para extraer datos médicos de archivos que anteriormente no eran legibles por máquina. Esto brinda la oportunidad de integrar estos datos con sus registros de salud electrónicos u otras tecnologías en la nube, como Amazon Comprehend Medical, que pueden identificar información de salud protegida en el conjunto de datos. Este es solo un paso más en el aumento de las oportunidades de utilizar estas tecnologías emergentes para mejorar el acceso a los datos, obtener mejores conocimientos, reducir los costos y mejorar las experiencias de los pacientes y miembros”.

Matt Ferrari, director de tecnología de ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Conozca las características de Amazon Textract

Descubra más características de Amazon Textract.

Más información 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Inscríbase para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comience a crear en la consola

Comience a crear con Amazon Textract en la consola de administración de AWS.

Regístrese