Publié le: Dec 1, 2021

Amazon Textract, un service de machine learning qui simplifie l'extraction du texte et des données à partir de n'importe quel document ou image, offre désormais la prise en charge spécialisée de l'extraction de données depuis des documents d'identité, par exemple les permis de conduire et les passeports américains. Vous pouvez extraire des champs implicites, comme le nom et l'adresse, ainsi que des champs explicites, comme la date de naissance, la date de délivrance, la date d'expiration, le numéro d'identification, le type de document d'identification et plus encore, sous forme de paires clés-valeurs. Jusqu'ici, les solutions OCR existantes étaient limitées. En effet, elles n'offraient la possibilité ni d'extraire avec précision tous les champs requis, en raison d'images d'arrière-plan diversifiées, ni de reconnaître les noms et les adresses ainsi que les champs associés à ces informations (par exemple, les documents d'identification de l'État de Washington répertorient les adresses postales avec la clé « 8 »). Par ailleurs, ces solutions ne prenaient pas en charge les conceptions et formats de pièces d'identification variables d'un pays ou d'un État à un autre.

À partir d'aujourd'hui, vous pouvez extraire de manière rapide et précise des informations de pièces d'identification (par exemple les permis de conduire et les passeports américains) qui se présentent sous une variété de modèles ou de formats. L'API Analyze ID renvoie deux catégories de données :
  • les paires clés-valeurs, disponibles sur les pièces d'identification, comme la date de naissance, la date de délivrance, le numéro d'identification et les restrictions ;
  • les champs implicites du document, qui peuvent ne pas être associés à des clés explicites, tels que le nom, l'adresse et le nom de l'autorité signataire.

Par ailleurs, nous standardisons les noms de clés dans la réponse. Par exemple, si votre permis de conduire porte la mention du « numéro de permis » et le passeport celle du numéro de passeport, l'API Analyze ID renvoie la clé standardisée sous la forme « ID du document » ainsi que la clé brute (par exemple numéro de permis). Avec cette standardisation, les clients peuvent combiner des informations provenant de nombreux documents d'identification qui utilisent des termes différents pour le même concept.

Pour en savoir plus sur cette nouvelle fonction, vous pouvez lire l'article de blog étape par étape pour démarrer dès maintenant, ou vous pouvez consulter la documentation. La tarification de cette nouvelle fonction est disponible sur la page de tarification d'Amazon Textract. 

À compter du 1er décembre 2021, Analyze ID sera disponible dans les régions suivantes : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Californie du Nord), USA Ouest (Oregon), GovCloud (US, côte est), GovCloud (US côte ouest), Canada (Centre), Europe (Londres), Europe (Paris), Europe (Irlande), Europe (Francfort), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Séoul) et Asie-Pacifique (Mumbai). Pour démarrer avec Analyze ID, consultez http://aws.amazon.com/textract.