Publicado en: Apr 3, 2023

Amazon Textract es un servicio administrado de machine learning que extrae automáticamente texto, escritura a mano y datos de documentos escaneados. Mejoramos continuamente la precisión de los modelos de machine learning subyacentes y añadimos nuevas características en función de los comentarios de los clientes. Hoy nos complace anunciar nuevas características y mejoras en la precisión para la característica AnalyzeDocument: Tables para ayudar a los clientes a automatizar sus flujos de trabajo de procesamiento de documentos. 

La nueva actualización del modelo de tablas añade compatibilidad para cuatro elementos nuevos que suelen encontrarse en las estructuras tabulares de los documentos: el título de la tabla, los títulos de las secciones, los pies de página de las tablas y las celdas de resumen. Los clientes podrán extraer directamente estos elementos de las estructuras tabulares y ahorrar tiempo en la escritura y el mantenimiento de códigos complejos de posprocesamiento. Además, también proporciona una forma de identificar el tipo de tabla. Por último, nos complace anunciar las mejoras generales en la precisión de los documentos que se encuentran comúnmente en las industrias de seguros, los servicios financieros, las hipotecas y la fabricación. 

Esta actualización estará disponible en el Este de EE. UU. (Ohio, Norte de Virginia), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Asia-Pacífico (Bombay, Seúl, Singapur, Sídney), Canadá (centro), Europa (Fráncfort, Irlanda, Londres, París) y en las regiones de AWS GovCloud (Este de EE. UU., Oeste de EE. UU.).

Para comenzar, inicie sesión en la consola de Amazon Textract y pruebe la nueva característica. Para obtener más información sobre las capacidades de Textract, visite el sitio web de Amazon Textract, la guía para desarrolladores o la página de recursos.