Amazon Textract

Extraiga texto y datos con facilidad de prácticamente cualquier documento
Amazon Textract es un servicio de aprendizaje automático completamente administrado que extrae automáticamente texto y datos de documentos escaneados. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas.

En la actualidad, muchas empresas extraen datos de documentos escaneados, como archivos PDF, tablas y formularios, a través de la entrada manual de datos (que es lenta, costosa y propensa a errores), o mediante un software simple de OCR que requiere una configuración manual que debe actualizarse cada vez que cambia el formulario para que sea utilizable.
 
Para superar estos procesos manuales, Textract utiliza el aprendizaje automático para leer y procesar instantáneamente cualquier tipo de documento y extrae con precisión texto, formularios, tablas y otros datos sin la necesidad de ningún trabajo manual o código personalizado.

Con Textract, puede automatizar rápidamente las actividades manuales de documentos, lo que le permite procesar millones de páginas de documentos en horas. Una vez que se obtiene la información, puede tomar medidas al respecto dentro de las aplicaciones de su negocio para iniciar los siguientes pasos para una solicitud de préstamo, documento fiscal, formulario de inscripción o procesamiento de reclamos médicos. Además, puede crear índices de búsqueda inteligentes o agregar revisiones humanas con Amazon Augmented AI con el objetivo de revisar datos variados o confidenciales.

Beneficios

Extraiga datos estructurados y no estructurados de forma rápida y precisa

Amazon Textract utiliza inteligencia artificial para “leer” documentos como lo haría una persona y extrae no solo texto sino también tablas, formularios y otros datos estructurados sin configuración, entrenamiento ni códigos personalizados. Amazon Textract detecta automáticamente el diseño de un documento y los elementos clave en la página, entiende las relaciones entre datos en cualquier formulario o tabla integrado y extrae todo con su contexto intacto.

Vaya más allá del simple reconocimiento óptico de caracteres (OCR)

Amazon Textract utiliza la tecnología de OCR para identificar etiquetas y valores de formularios, y extrae información de las tablas sin comprometer la estructura a un bajo costo. Solo paga por lo que usa y no hay compromisos iniciales ni contratos a largo plazo. 

Seguridad y conformidad

Textract se puede usar para cargas de trabajo que están sujetas a la conformidad con las normas del Control de la Organización de Servicios (SOC) y de la Organización Internacional de Normalización (ISO), así como PCI, HIPAA y GPDR, lo que significa que los clientes en finanzas, atención de la salud y más pueden obtener una visión más detallada de los procesos y controles de seguridad que protegen los datos del cliente.

Implemente fácilmente revisiones hechas por humanos

Amazon Textract está directamente integrado con Amazon Augmented AI (Amazon A2I) para que pueda implementar fácilmente las revisiones hechas por humanos del texto extraído de los documentos. Puede integrar revisiones humanas para administrar flujos de trabajo confidenciales o exigentes que requieran del criterio humano para lograr predicciones de alta fiabilidad, o para auditar predicciones de forma habitual.

What is Amazon Textract (1:49)

Casos de uso

Crear índices de búsqueda inteligente

Extraiga datos estructurados de documentos y cree un índice inteligente para poder buscar rápidamente en millones de estados financieros. Por ejemplo, una compañía de préstamo hipotecario podría usar Amazon Textract para procesar millones de solicitudes de préstamos escaneadas en cuestión de horas e indexar los datos extraídos en Amazon Elasticsearch. Esto les permitiría crear búsquedas como, p. ej., "búsqueda de solicitudes de préstamos donde el nombre del solicitante es John Doe" o "búsqueda de contratos donde la tasa de interés es del 2 %".

Cree flujos de trabajo de procesamiento de documentos automatizados

Amazon Textract puede proporcionar las entradas necesarias para procesar formularios automáticamente sin intervención humana. Por ejemplo, los bancos pueden automatizar las solicitudes de préstamos con Amazon Textract. La información que contiene el documento podría usarse para iniciar todos los antecedentes necesarios y las verificaciones de crédito para aprobar el préstamo, de modo que los clientes puedan obtener resultados instantáneos de su solicitud en lugar de tener que esperar varios días para la revisión y la validación manuales.

Mantener la conformidad en los archivos de documentos

Debido a que Amazon Textract identifica los tipos de datos y las etiquetas de los formularios de forma automática, es fácil mantener la conformidad con los controles de la información. Por ejemplo, una aseguradora podría usar Amazon Textract para alimentar un flujo de trabajo que redacta automáticamente la información de identificación personal (PII) a fin de revisarla antes de archivar los formularios de reclamación, mediante el reconocimiento automático de los pares clave-valor importantes que requieren protección.

Historias de éxito de los clientes

600x400-cambia-health-solutions_logo

Cambia Health Solutions es una compañía de soluciones de salud total y la compañía matriz de seis planes de salud regionales, incluida Regence, una aseguradora que presta servicios a 2,6 millones de miembros en Oregón, Idaho, Utah y Washington.

“En los últimos 100 años, Cambia se ha dedicado a mejorar la atención médica para las personas y sus familias. Para ayudarnos a lograr ese objetivo, siempre evaluamos nuevas innovaciones y oportunidades para optimizar la coordinación de la atención. Una de las áreas de interés es la optimización de los procesos administrativos que requieren mucho tiempo y trabajo. Estamos encantados de explorar Amazon Textract para ayudarnos a automatizar el proceso de extracción de datos valiosos de formularios en papel, de forma precisa y eficiente. La poderosa combinación de ciencia de datos, IA y un enfoque centrado en la persona es clave para nuestra misión de transformar el sistema de atención médica”.

Faraz Shafiq, director de Inteligencia Artificial de Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare es una compañía líder en tecnología de atención médica independiente que brinda soluciones basadas en datos y análisis para mejorar los resultados clínicos, financieros y de participación del paciente en el sistema de atención médica de EE. UU.

“En Change Healthcare, creemos que podemos hacer que la atención médica sea asequible y accesible para todos con la mejora de la puntualidad y la calidad de las decisiones financieras y administrativas. Esto se puede lograr mediante el poder de la tecnología de aprendizaje automático para comprender mejor nuestros datos. Pero, desbloquear el potencial de esta información, a menudo, puede ser difícil, ya que está almacenada en tablas y formas que el reconocimiento óptico de caracteres tradicional no ha podido analizar. Amazon Textract mejora aún más la comprensión de los documentos gracias a la capacidad de recuperar datos estructurados además del texto, y ahora que el servicio cumple con la ley HIPAA, podremos liberar la información de millones de documentos y crear aún más valor para los pacientes, los pagadores y los proveedores”.

Nick Giannasi, vicepresidente ejecutivo y director general de Inteligencia Artificial de Change Healthcare


CD_2018_Primary_Logo_w_TM

La innovadora plataforma de soluciones y servicios de ClearDATA protege a los clientes de los riesgos de privacidad de datos, mejora su gestión de datos y escala su infraestructura de TI de atención médica. Esto permite a la industria centrarse en mejorar la atención médica al progresar en la prestación de atención médica todos los días.

“Es emocionante ver a AWS agregar su servicio de reconocimiento óptico de caracteres con tecnología de aprendizaje automático, Textract, a su lista de servicios elegibles de HIPAA. Una gran cantidad de datos médicos que se comparte entre los pagadores y los proveedores están encerrados en archivos basados en imágenes como PDF. En lugar de procesar manualmente ese tipo de datos, las organizaciones de atención médica ahora pueden usar el servicio Amazon Textract para extraer datos médicos de archivos que anteriormente no eran legibles por máquina. Esto brinda la oportunidad de integrar estos datos con sus registros de salud electrónicos u otras tecnologías en la nube, como Amazon Comprehend Medical, que pueden identificar información de salud protegida en el conjunto de datos. Este es solo un paso más en el aumento de las oportunidades de utilizar estas tecnologías emergentes para mejorar el acceso a los datos, obtener mejores conocimientos, reducir los costos y mejorar las experiencias de los pacientes y miembros”.

Matt Ferrari, director de tecnología de ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Conozca las características de Amazon Textract

Descubra más características de Amazon Textract.

Más información 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comience a crear en la consola

Comience a crear con Amazon Textract en la consola de administración de AWS.

Regístrese