Publicado en: Jul 27, 2021

Amazon Textract, un servicio de machine learning que extrae texto y datos estructurados de cualquier documento o imagen, ahora ofrece un soporte especializado para las facturas y los recibos. Hasta ahora, estos importantes documentos eran difíciles de procesar en escala porque no siguen reglas de diseño establecidas y, en ocasiones, requieren contexto para poder interpretarse de manera correcta. Por ejemplo, los clientes pueden llegar a necesitar extraer el nombre del proveedor del logotipo de Amazon en la parte superior de una factura, a pesar de no estar marcado como “proveedor: Amazon”. Ahora con Textract, los clientes pueden extraer de manera explícita datos etiquetados, datos implícitos y conceptos desde listas desglosadas de bienes o servicios de casi cualquier factura o recibo sin plantillas o configuración.

A partir del día de la fecha, Amazon Textract agrega la siguiente posibilidad para los recibos y las facturas: 1) Identifica el nombre del proveedor: Amazon Textract puede encontrar el nombre del proveedor en un recibo incluso si solo se encuentra indicado en el logotipo de la página sin la etiqueta explícita que diga “proveedor”. También puede encontrar y extraer elementos, cantidades y precios que no están etiquetados con los encabezados de columna para los conceptos, 2) Habilita la consolidación de la salida de muchos de los documentos: Textract regulariza los nombres clave y los encabezados de columna cuando extrae datos de las facturas y los recibos hacia una taxonomía estándar. Por ejemplo, puede detectar que “factura nro.”, “factura número” y “recibo #” son idénticos y saca “FACTURA_RECIBO_ID”, para que las aplicaciones posteriores puedan comparar fácilmente la salida de muchos documentos, y 3) Extrae los detalles de los conceptos, incluso cuando faltan los encabezados de columna: Textract extrae los conceptos, incluidos los elementos, cantidades y precios de los bienes individuales adquiridos de una factura o de un recibo. Si la tabla de conceptos no incluye encabezados de columna, ahora Textract deduce qué encabezados de columnas debería haber, basados en el contenido de la tabla.

Lea sobre uno de nuestros clientes:

Fundada en 2010, Paymerang facilita pagos electrónicos a proveedores para empresas sencillas, seguras y rentables. “Ayudamos a los clientes en diversas verticales para simplificar los procesos de cuentas a pagar mediante la eliminación de las tareas de rutina, al pagar de manera electrónica a los proveedores y obtener reembolsos en efectivo en el proceso”, asegura Jason Losh, director de Plataformas empresariales en Paymerang. “Utilizamos Amazon Textract, un servicio elegible de HIPAA, para ayudar a nuestros clientes en la vertical de la sanidad a extraer datos automáticamente de las facturas sin utilizar lógica personalizada para estandarizar la información extraída”. “Al extraer y clasificar los datos en un conjunto consistente de campos estandarizados, Amazon Textract nos ayuda a prestar servicio a los clientes que utilizan proveedores que no siguen un patrón común para el diseño de las facturas”.

Para obtener más información sobre esta característica, consulte la documentación que la explica con mayor detalle y la publicación en el blog que describe cómo utilizar Textract para las facturas y los recibos con una nueva API llamada AnalyzeExpense. Este enlace dirige hacia la página de precios.

AnalyzeExpense se lanzará por partes y comenzará en la región de Asia-Pacífico (Singapur) el 26 de julio, luego Europa (Irlanda) el 27 de julio, Asia-Pacífico (Sídney), EE. UU. Este (Ohio), EE. UU. Oeste (Norte de California) el 28 de julio, Europa (Fráncfort), Europa (Londres), EE. UU. Este (Norte de Virginia) el 29 de julio, Asia-Pacífico (Seúl), Asia-Pacífico (Mumbai), Canadá (Central), Europa (París), EE. UU. Oeste (Oregón) el 30 de julio y en las regiones de GovCloud (EE. UU. Este) y GovCloud (EE. UU. Oeste) el 2 de agosto.