Publié le: Dec 18, 2019

Amazon Textract est un service de machine learning qui facilite et accélère la récupération de texte et de données structurées comme des tableaux et des formulaires, à l'aide de nos API DetectText ou AnalyzeDoc, sans qu'une configuration ou des modèles personnalisés soient nécessaires. L'un des avantages d'un service géré comme Amazon Textract est que les clients bénéficient d'améliorations en continu au fil du temps. Aujourd'hui, nous avons le plaisir d'annoncer qu'Amazon Textract est désormais certifié PCI DSS. Cela signifie que vous pouvez désormais utiliser Amazon Textract pour l'ensemble des workloads nécessitant des standards de sécurité de l'information Payment Card Industry Data Security Standard (PCI DSS), comme les données des titulaires de cartes (CHD) ou les données d'authentification sensibles (SAD). De plus, à partir d'aujourd'hui, AWS lance une série d'améliorations de la qualité qui rendent Amazon Textract encore plus précis pour nos fonctions tableau et formulaire. 

Tout d'abord, notre modèle de tableaux fonctionne désormais mieux avec des structures de tableau complexes contenant des cellules divisées et des cellules fusionnées, qui rendent difficile le bon alignement des valeurs des cellules avec le bon en-tête de colonne ou de ligne. Ensuite, Amazon Textract s'est encore plus amélioré concernant l'identification des lignes et des colonnes pour les cellules dont le texte est renvoyé à la ligne (présent sur plusieurs lignes), même pour les tableaux sans limites explicites. Amazon Textract détermine désormais de manière plus précise les cellules dont le contenu se situe sur plusieurs lignes, comparé à lorsqu'il s'agit d'une nouvelle ligne sans limite explicite. Enfin, Amazon Textract a également amélioré le modèle de formulaires pour fournir des résultats plus précis pour l'identification de paires de clés-valeurs. Ces avantages s'appliquent à plusieurs types de documents, mais sont particulièrement utiles pour les documents contenant des tableaux et des paires de clés-valeurs sur la même page. Désormais, Amazon Textract identifie correctement les paires de clés-valeurs intégrées dans un tableau. 

Pour en savoir plus sur ces mises à jour, consultez cette page