Publicado en: Dec 1, 2021

Amazon Textract, un servicio de machine learning que facilita la extracción de texto y datos a partir de cualquier documento o imagen, ofrece ahora compatibilidad especializada con la extracción de datos de documentos de identidad, como los permisos de conducir y los pasaportes de los EE. UU. Puede extraer campos implícitos, como el nombre y la dirección, así como campos explícitos, como la fecha de nacimiento, la fecha de expedición, la fecha de de vencimiento, el número de identificación, el tipo de identificación, etc., en forma de pares clave-valor. Hasta ahora, las soluciones actuales basadas en el reconocimiento óptico de caracteres eran limitadas y no ofrecían la posibilidad de extraer con precisión todos los campos requeridos debido a la riqueza de las imágenes de fondo, ni la capacidad de reconocer los nombres y las direcciones, así como los campos asociados a estos ( por ejemplo, el DNI del estado de Washington incluye la dirección del domicilio con la clave “8”), así como tampoco admitían diseños y formatos de documentos de identidad que varían según el país o el estado.

A partir de hoy, puede extraer de forma rápida y precisa la información de los documentos de identidad (permisos de conducir y pasaportes de EE. UU.) que tienen diferentes plantillas o formatos. La API Analyze ID devuelve dos categorías de tipos de datos:
  • Pares clave-valor presentes en las identificaciones, como la fecha de nacimiento, la fecha de expedición, el número de identificación y las restricciones
  • Campos implícitos en el documento que posiblemente no tengan claves explícitas asociadas, como Nombre, Dirección y Expedido por

Además, estandarizamos los nombres de las claves dentro de la respuesta. Por ejemplo, si el permiso de conducir dice LIC# (número de licencia) y el pasaporte dice Número de pasaporte, la respuesta de Analyze ID devolverá la clave estandarizada como “Document ID” junto con la clave sin procesar (por ejemplo, LIC#). Esta estandarización permite a los clientes combinar fácilmente la información de varias identificaciones que utilizan diferentes términos para el mismo concepto.

Para obtener más información sobre esta nueva característica, puede leer un blog paso a paso para comenzar ahora o puede consultar la documentación. Los precios de esta nueva característica están disponibles en la página de precios de Amazon Textract. 

Analyze ID estará disponible en el Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), GovCloud (Este de EE. UU.), GovCloud (Oeste de EE. UU.), Canadá (Central), Europa (Londres), Europa (París), Europa (Irlanda), Europa (Fráncfort), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai) a partir del 1 de diciembre de 2021. Para comenzar a utilizar Analyze ID, visite: http://aws.amazon.com/textract.