Publié le: Mar 30, 2022

Amazon Textract est un service de machine learning qui permet d'extraire facilement du texte et des données de presque tout document. Nous améliorons en permanence les modèles de machine learning sous-jacents en fonction des commentaires des clients afin de fournir une plus grande précision. Aujourd'hui, nous sommes ravis d'annoncer quelques améliorations de la qualité de nos fonctions de tableaux et de détection de cases à cocher.

Les modèles de tableaux les plus récents prennent en charge la détection de cellules fusionnées et l'identification d'en-têtes de colonnes. Plus spécifiquement, vous pouvez désormais détecter des cellules fusionnées dans un document traité à l'aide de la fonction AnalyzeDocument-Tables en utilisant le « Type » : « MERGED_CELL », mais aussi identifier les cellules qui composent l'en-tête de colonne par l'identifiant « EntityTypes » : ["COLUMN_HEADER"]. Par ailleurs, nous sommes heureux d'annoncer des améliorations de la qualité de notre fonction de tableaux. À partir d'aujourd'hui, Textract détecte plus précisément les limites extérieures du tableau, les limites des lignes et des colonnes et le contenu du tableau. Les clients peuvent désormais s'attendre à des niveaux de précision plus élevés avec des niveaux de post-traitement plus faibles lors de l'extraction de tableaux dans une grande variété de types de documents, notamment les documents propres aux secteurs financier, juridique, public, du crédit, des assurances, des soins de santé et de l'énergie.

Enfin, nous avons amélioré les fonctionnalités de détection de cases à cocher dans le modèle de formulaire. Grâce à ces améliorations, vous pouvez désormais utiliser Amazon Textract pour détecter avec plus de précision des informations manuscrites sélectionnées ou non sélectionnées dans des cases à cocher de champs de formulaires.

Pour démarrer, connectez-vous à la console Amazon Textract pour essayer la dernière fonction de tableaux et de détection de cases à cocher. Pour en savoir plus sur les fonctionnalités de Textract, consultez le site web d'Amazon Textract, le guide du développeur ou la page des ressources.