Amazon Textract

Extraiga con facilidad texto impreso, manuscrito y datos prácticamente de cualquier documento

Amazon Textract es un servicio de machine learning que extrae texto, escritura a mano y datos de documentos escaneados de forma automática. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas. En la actualidad, muchas empresas extraen datos de documentos como archivos PDF, imágenes, tablas y formularios escaneados de forma manual o mediante un software de OCR simple que requiere una configuración manual y a menudo exige una reconfiguración cuando cambia de formulario. Textract, para superar estos procesos manuales y costosos, utiliza el machine learning a fin de leer y procesar cualquier tipo de documento y extraer con precisión texto, escritura a mano, tablas y otros datos sin esfuerzo manual. Puede automatizar el procesamiento de documentos y tomar medidas sobre la información que se extrae, ya sea mediante la automatización del procesamiento de préstamos o documentos fiscales. Textract puede extraer los datos en minutos en lugar de horas o días. Además, puede agregar revisiones humanas con Amazon Augmented AI para supervisar los modelos y llevar a cabo revisiones de datos confidenciales.

What is Amazon Textract (1:49)

Beneficios

Extraiga datos estructurados y no estructurados

Amazon Textract utiliza inteligencia artificial para leer como lo haría un humano, mediante la extracción de texto, diseños, tablas, formularios y datos estructurados con contexto y sin configuración, entrenamiento ni códigos personalizados.

Vaya más allá del simple reconocimiento óptico de caracteres (OCR)

Amazon Textract utiliza la tecnología de OCR para identificar etiquetas y valores de formularios, y extrae información de las tablas sin comprometer la estructura a un bajo costo. Solo paga por lo que usa y no hay compromisos iniciales ni contratos a largo plazo.

Elija la seguridad y la conformidad de los datos

Amazon Textract cumple con el Control de Organización de Servicio (SOC), la Organización Internacional de Normalización (ISO), así como con PCI, HIPAA y GDPR, lo que significa que los clientes pueden obtener una visión más detallada de los procesos y controles de seguridad que protegen los datos del cliente. Además, Textract admite los puntos de enlace de Amazon Virtual Private Cloud (VPC) a través de AWS Privatelink y KMS, lo que permite que los clientes eviten usar la Internet pública y cifrar sus datos.

Implemente fácilmente revisiones humanas

Amazon Textract está directamente integrado con Amazon Augmented AI (Amazon A2I) para que pueda implementar fácilmente las revisiones humanas del texto extraído de los documentos. Puede integrar revisiones humanas para administrar flujos de trabajo confidenciales o exigentes que requieran la supervisión humana a fin de lograr predicciones de alta fiabilidad o auditar predicciones de forma habitual.

Casos de uso

Servicios financieros
Sectores sanitario y de ciencias biológicas
Sector público

Servicios financieros

Los formularios financieros como los de solicitudes de hipotecas, W-2 y demás pueden contener información comercial fundamental como tasas de hipotecas, nombres de solicitantes e información fiscal importante que debe extraerse y analizarse. Con Amazon Textract, puede extraer información de documentos, tablas y formularios escaneados, además de procesar aplicaciones en minutos para brindar a sus clientes una respuesta rápida.

Sectores sanitario y de ciencias biológicas

Amazon Textract puede escanear miles de formularios de seguros y sanidad, extraer la información de esos formularios y mantenerla organizada y en su contexto original, lo que evita tener que revisar los datos de salida de forma manual. Proporcione un mejor servicio a sus pacientes y aseguradoras al extraer datos importantes del paciente de los formularios de admisión sanitaria, reclamos de seguros y formularios de autorización previa.

Sector público

Procesar formularios relacionados con el gobierno, como préstamos para pequeñas empresas, formularios de impuestos federales o aplicaciones comerciales, requiere miles de horas manuales a fin de extraer los datos relevantes e importantes. Amazon Textract puede extraer todos los datos de estos documentos, ya sean PDF, imágenes o documentos escaneados, mediante el reconocimiento óptico de caracteres (OCR). Textract no solo identifica cada carácter, palabra y letra, sino también el contenido de los campos de un formulario y la información almacenada en tablas con alta precisión.

Historias de éxito de los clientes

Kabbage

Kabbage es una empresa de datos y tecnología que proporciona soluciones de flujo de efectivo para pequeñas empresas, incluido acceso a líneas de crédito flexibles, pagos en línea, información de flujo de efectivo y cuentas corrientes empresariales.

“Amazon Textract nos ayudó a respaldar al 80 % de los postulantes de PPP para que reciban una experiencia de préstamo completamente automatizada y redujo los tiempos de aprobación de varios días a una velocidad mediante de 4 horas. Para fines del programa, nos convertimos en la segunda entidad crediticia de PPP más grande de la nación por volumen de solicitudes, superando a los principales bancos de EE. UU., ya que prestamos servicios a más de 297 000 pequeñas empresas y preservamos aproximadamente 945 000 trabajos en todo el país”.

Anthony Sabelli, director de ciencia de datos de Kabbage

Change Healthcare

Change Healthcare es una compañía líder en tecnología de atención médica independiente que brinda soluciones basadas en datos y análisis para mejorar los resultados clínicos, financieros y de participación del paciente en el sistema de atención médica de EE. UU.

“En Change Healthcare, creemos que podemos hacer que la atención médica sea asequible y accesible para todos con la mejora de la puntualidad y la calidad de las decisiones financieras y administrativas. Esto se puede lograr mediante el poder de la tecnología de aprendizaje automático para comprender mejor nuestros datos. Pero, desbloquear el potencial de esta información, a menudo, puede ser difícil, ya que está almacenada en tablas y formas que el reconocimiento óptico de caracteres tradicional no ha podido analizar. Amazon Textract mejora aún más la comprensión de los documentos gracias a la capacidad de recuperar datos estructurados además del texto, y ahora que el servicio cumple con la ley HIPAA, podremos liberar la información de millones de documentos y crear aún más valor para los pacientes, pagadores y proveedores”.

Nick Giannasi, vicepresidente ejecutivo y director general de IA de Change Healthcare

Filevine

Filevine es el núcleo operativo para profesionales legales, incluidos gestión de problemas y casos basados en la nube, gestión de documentos y análisis de informes profundos. Desde su lanzamiento en 2015, Filevine se centró en la innovación rápida y el diseño galardonado, lo que redituó en las mayores clasificaciones de parte de sitios de reseña independientes.

“Todos los días, se presentan millones de archivos de problemas y casos en Filevine. Elegimos Amazon Web Services porque queremos ofrecer las mejores soluciones de búsqueda de documentos de su clase para nuestros clientes. Amazon Textract es rápido, preciso y escalable: ayuda a Filevine a reunir los requisitos rigurosos de las organizaciones jurídicas más grandes y sofisticadas del mundo. Con Filevine y Amazon, encontrar la proverbial aguja en el pajar es más fácil que nunca para los profesionales jurídicos”.

Ryan Anderson, director general ejecutivo de Filevine

Intuit

Intuit provee soluciones administrativas financieras innovadoras, incluidas TurboTax y QuickBooks, a unos 50 millones de clientes en todo el mundo.

“La tecnología de comprensión de documentos de Intuit utiliza IA a fin de eliminar la entrada manual de datos para nuestros clientes autónomos, consumidores y pequeñas empresas. Para millones de estadounidenses que confían en TurboTax cada año, esta tecnología simplifica la declaración de impuestos al ahorrarles la tarea lenta y tediosa de ingresar los datos de los documentos financieros. Textract es un elemento importante de la capacidad de comprensión de documentos de Intuit, ya que mejora la precisión de la extracción de datos al analizar el texto en el contexto de los formularios financieros complejos”.

Krithika Swaminathan, vicepresidenta de IA de Intuit

Standard Product Icons (Features) Squid Ink
Conozca las características de Amazon Textract

Descubra más características de Amazon Textract.

Más información 
Sign up for a free account
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Standard Product Icons (Start Building) Squid Ink
Comience a crear en la consola

Comience a crear con Amazon Textract en la consola de administración de AWS.

Registrarse