Amazon Textract

Extraire facilement du texte imprimé ou manuscrit ainsi que des données de pratiquement n'importe quel document.

Amazon Textract est un service de machine learning qui extrait automatiquement du texte, de l'écriture manuscrite et des données à partir de documents numérisés. Il va au-delà de la simple reconnaissance optique des caractères (OCR) pour identifier, comprendre et extraire les données de formulaires et de tables. De nos jours, de nombreuses entreprises extraient manuellement des données à partir de documents analysés, tels que les fichiers PDF, les images, les tableaux et formulaires, ou par l'intermédiaire de simples logiciels OCR. Cela requiert une configuration manuelle qui, souvent, doit être adaptée en fonction du formulaire. Pour éliminer ces processus manuels onéreux, Textract utilise le machine learning pour lire et traiter tout type de document, extraire de manière précise le texte imprimé ou manuscrit, les tableaux et d'autres données sans action manuelle. Vous pouvez rapidement automatiser le traitement des documents et exploiter les informations extraites, qu'il s'agisse d'automatiser le traitement des prêts ou d'extraire des informations des factures et des reçus. Quelques minutes suffisent à Textract pour extraire les données, et non des heures ou des jours. En outre, vous pouvez ajouter Amazon Augmented AI pour les vérifications humaines afin de superviser vos modèles et évaluer les données sensibles.

1 000 pages gratuites

par mois avec l'offre gratuite AWS

Avantages

Extraction de données structurées ou non

Amazon Textract utilise l'intelligence artificielle pour lire les documents comme le ferait une personne humaine, en extrayant du texte, des mises en page, des tableaux, des formulaires et d'autres données structurées avec contexte et sans configuration, formation ni code personnalisé.

Au-delà de la simple reconnaissance optique des caractères (OCR)

Amazon Textract utilise la technologie OCR pour identifier les étiquettes et les valeurs de formulaire, et extrait des informations à partir de tableaux sans compromettre la structure, et ce, à bas coût. Vous ne payez que ce que vous consommez, sans engagement initial ni contrat à long terme.

Sécurité et conformité des données

Amazon Textract est conforme aux normes Service Organization Control (SOC), International Organization for Standardization (ISO), ainsi qu'aux normes PCI, HIPAA et GDPR, ce qui signifie que les clients peuvent obtenir des informations détaillées sur les processus et les contrôles de sécurité qui protègent les données des clients. De plus, Textract prend en charge les points de terminaison Amazon Virtual Private Cloud (VPC) via AWS Privatelink et KMS, ce qui évite aux clients d'avoir à utiliser l'Internet public et de chiffrer leurs données.

Mise en place facile de la vérification humaine

Amazon Textract s'intègre directement à Amazon Augmented AI (Amazon A2I), ce qui vous permet de facilement mettre en place la vérification humaine du texte extrait de documents. Vous pouvez intégrer des vérifications humaines pour gérer des flux de travail nuancés ou sensibles qui nécessitent une supervision humaine afin d'obtenir des prévisions hautement fiables ou d'auditer des prévisions de manière continue.

Cas d'utilisation

Services financiers

Services financiers

Les formulaires financiers tels que les demandes de prêt immobilier, les formulaires W-2, les factures, etc., peuvent contenir des informations commerciales essentielles telles que les taux de crédit immobilier, les noms des demandeurs, les totaux des factures et des informations fiscales importantes qui doivent être extraites et analysées. Avec Amazon Textract, vous pouvez extraire des informations de documents numérisés, de PDF et d'images contenant des tableaux et des formulaires, et traiter les demandes en quelques minutes afin de fournir une réponse rapide à vos clients.

Soins de santé et sciences de la vie

Santé et sciences de la vie

Amazon Textract peut scanner des milliers de formulaires médicaux et d'assurance, en extraire les informations tout en conservant leur contexte d'origine, afin de vous éviter de vérifier manuellement la sortie. Fournissez un service de meilleure qualité à vos patients et assureurs en extrayant des données importantes de formulaires médicaux, de déclarations de sinistres et de formulaires d'autorisation préalable.

Secteur public

Secteur public

Le traitement de formulaires du gouvernement, tels que les prêts aux petites entreprises, les formulaires fiscaux ou les candidatures exige des milliers d'heures pour en extraire les données pertinentes et importantes. Amazon Textract peut extraire toutes les données de ces documents, qu'il s'agisse d'images, de fichiers PDF ou de documents analysés à l'aide de la technologie OCR. Textract identifie non seulement le moindre caractère, mot ou lettre, mais le contenu des champs des formulaires et les informations présentes dans les tableaux avec une grande précision.

Témoignages de réussite

Kabbage

Foresight Group est une entreprise familiale diversifiée sur le plan stratégique, qui construit un héritage pour l'avenir. Centré sur les expéditions, le forage offshore, les infrastructures portuaires et gazières et le capital-investissement en Inde, le groupe est devenu au fil des ans un conglomérat d'entreprises internationales.

Nous voulions automatiser notre facturation sur SAP. Actuellement, nous traitons les factures manuellement, ce qui représente 15 à 20 minutes par facture. Le membre de l'équipe AP récupère une pièce jointe dans un e-mail, extrait manuellement les données de la facture, et saisit les données dans plusieurs systèmes comptables. Au début, nous nous interrogions sur l'automatisation. Ensuite, InfraBeat, un de nos partenaires a évalué différentes solutions OCR. S'étant prononcé sur Amazon Textract, InfraBeat a proposé un IRPA SAP combiné à une solution Amazon Textract pour atteindre un niveau de précision élevé et n'apporter que des ajustements mineurs à leur logique. En termes d'extraction de données, la précision est primordiale. Les résultats obtenus avec Amazon Textract ont dépassé nos attentes. Ils sont cohérents entre les systèmes et révèlent une précision de 90 % entre les factures. » 

Group TI, Foresight Group

Change Healthcare

Change Healthcare est une société indépendante de premier plan dans le domaine des technologies de la santé qui fournit des données et des solutions analytiques pour améliorer les résultats cliniques, financiers et l'engagement des patients dans le système de santé américain.

« Chez Change Healthcare, nous pensons pouvoir rendre la santé abordable et accessible à tous en améliorant la rapidité et la qualité des décisions financières et administratives. Cet objectif peut être atteint grâce au pouvoir de la technologie du machine learning, qui nous aiderait à mieux comprendre nos données. Cependant, débloquer le potentiel de ces informations s'avère souvent difficile étant donné que celles-ci sont isolées dans des tableaux et des formulaires que la reconnaissance optique de caractères classique n'est pas en mesure d'analyser. Amazon Textract réalise des progrès en matière de compréhension des documents grâce à sa capacité à récupérer des données structurées en plus du texte. En outre, étant donné que le service est désormais conforme à la loi HIPAA, nous allons pouvoir libérer les informations de millions de documents et créer encore plus de valeur pour nos patients, nos payeurs et nos fournisseurs. »

Nick Giannasi, vice-président exécutif et responsable de l'IA chez Change Healthcare

Filevine

Filevine est le centre opérationnel des professionnels du droit, y compris de la gestion des dossiers et des matières dans le cloud, la gestion des documents et l'analyse approfondie des rapports. Dès son lancement en 2015, Filevine s'est concentré sur l'innovation rapide et la conception primée, obtenant les meilleures notes des sites d'évaluation indépendants.

« Des millions d'affaires et de dossiers sont traités chaque jour dans Filevine. Nous avons choisi Amazon Web Services parce que nous voulions offrir à nos clients les meilleures solutions de recherche de documents de leur catégorie. Amazon Textract est rapide, précis et évolutif ; il aide Filevine à répondre aux exigences des organisations juridiques les plus importantes et les plus élaborées du monde. Avec Filevine et Amazon, il n'a jamais été aussi facile pour les professionnels du droit de trouver cette fameuse aiguille dans une botte de foin ».

Ryan Anderson, président-directeur général de Filevine

Intuit

Intuit est fournisseur de solutions de gestion financière innovantes, dont TurboTax et QuickBooks, auprès d'environ 50 millions de clients dans le monde entier.

« La technologie de compréhension des documents d'Intuit utilise l'IA pour éviter à nos clients, petites entreprises et professionnels indépendants de saisir des données manuellement. Pour les millions d'Américains qui ont recours à TurboTax tous les ans, cette technologie simplifie la déclaration d'impôts en leur épargnant la saisie fastidieuse de données à partir de documents financiers. Textract représente une partie importante de la fonctionnalité d'analyse de documents d'Intuit en améliorant la précision d'extraction des données grâce à l'analyse de texte dans les formulaires financiers compliqués. »

Krithika Swaminathan, VP de l'IA chez Intuit

Standard Product Icons (Features) Squid Ink
Découvrir les fonctions d'Amazon Textract

Découvrez davantage de fonctionnalités Amazon Textract.

En savoir plus 
Sign up for a free account
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Standard Product Icons (Start Building) Squid Ink
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire