Publié le: May 29, 2019
Nous avons le plaisir d’annoncer la mise à disposition pour tous d’Amazon Textract, qui a été en version préliminaire depuis le re:invent 2018. Amazon Textract est un service de machine learning géré qui extrait automatiquement le texte et les données structurées à partir de pratiquement n’importe quel document. Amazon Textract permet aux clients d'automatiser rapidement les flux de travail de documents en traitant des millions de pages de document en quelques heures.
Amazon Textract est plus qu’un logiciel d’OCR (reconnaissance optique des caractères) car il identifie également le contenu des champs de formulaire, les informations stockées dans les tableaux et le contexte dans lequel sont présentées les informations. L’API d’Amazon Textract prend en charge plusieurs formats d’image comme les numérisations, les PDF et les photos. Les clients peuvent l’utiliser en parallèle d’autres services de machine learning d’AWS tels qu’Amazon Comprehend, Amazon Comprehend Medical ou encore Amazon Translate pour déduire un sens plus profond au texte et aux données extraits. Le texte et les données extraits peuvent également servir à créer des recherches intelligentes sur d’importantes archives de document. Sinon, ils peuvent être chargés dans une base de données pour une utilisation par des applications comme les logiciels de comptabilité, d’audit et de conformité. Visitez le site web d'Amazon Textract pour en savoir plus sur Amazon Textract.
Amazon Textract est désormais disponible dans les régions AWS suivantes : Virginie du Nord, Ohio, Oregon et Irlande. Pour démarrer avec Amazon Textract, consultez le Guide de mise en route.