Publicado en: Dec 18, 2019
Amazon Textract es un servicio de aprendizaje automático que facilita y recupera rápidamente textos y datos estructurados como tablas y formularios mediante nuestras API DetectText o AnalizeDoc, sin requerir configuración personalizada o plantillas. Una de las ventajas de un servicio administrado como Amazon Textract es que los clientes se benefician de mejoras continuas a lo largo del tiempo. Hoy, nos complace anunciar que Amazon Textract posee la certificación PCI DSS. Esto significa que puede utilizar Amazon Textract para todas las cargas de trabajo que requieran información de seguridad Payment Card Industry Data Security Standard (PCI DSS), como la información del titular de la tarjeta (CHD) o información confidencial de autenticación (SAD). También hoy, AWS lanzó un grupo de mejoras de calidad que hacen de Amazon Textract más preciso para nuestras características de tablas y formularios.
Primero, nuestros modelos de tablas funcionan mejor con estructuras de tablas complejas que contienen celdas divididas y celdas combinadas, las cuales dificultan el alineamiento de los valores de las celdas a los encabezados de las columnas o filas correctas. Además, Amazon Textract siguió mejorando la identificación de las filas y columnas para celdas con texto ajustado (texto presente en múltiples líneas), incluso para tablas sin límites explícitos. Amazon Textract realiza una determinación más precisa de las celdas con contenido en varias líneas en lugar de cuando es una nueva fila sin un límite explícito. Finalmente, Amazon Textract mejoró el modelo de los formulario para ofrecer resultados más precisos para la identificación del par de valores clave. Los beneficios se aplican a muchos tipos de documentos, pero especialmente para los documentos que presentan tablas y pares de valores clave en la misma página. Ahora, Amazon Textract identifica correctamente los pares de valores clave incorporados en la tabla.
Puede obtener más información sobre estas actualizaciones aquí.