Publié le: Jun 23, 2021

Amazon Textract est un service de machine learning qui extrait automatiquement du texte, de l'écriture manuscrite et des données à partir de documents numérisés. Il va au-delà de la simple reconnaissance optique des caractères (OCR) pour identifier, comprendre et extraire les données de formulaires et de tables. Nous améliorons en permanence les modèles de machine learning sous-jacents en fonction des commentaires des clients afin de fournir une plus grande précision. Aujourd'hui, nous sommes heureux d'annoncer une mise à jour de l'amélioration de la précision pour notre fonction d'extraction de formulaires. À compter d'aujourd'hui, Textract détecte avec plus de précision les cases à cocher et les paires clé-valeur dans les documents et images. La précision est particulièrement améliorée pour les factures et les reçus. Cependant, vous noterez des améliorations dans de nombreux documents dans les domaines de la finance, de la santé, du droit, du secteur public, et plus encore.

Cette mise à jour sera lancée par vagues, suivant l'ordre ci-après : Asie-Pacifique (Sydney), Asie-Pacifique (Singapour), le 23 juin ; Europe (Irlande), Europe (Paris), Europe (Francfort), Europe (Londres), Asie-Pacifique (Séoul), Asie-Pacifique (Mumbai), le 24 juin ; Canada (Centre), USA Ouest (Californie du Nord), USA Est (Ohio), GovCloud (US, côte ouest), GovCloud (US, côte est), le 28 juin ; et USA Est (Virginie du Nord), USA Ouest (Oregon), le 29 juin.