Amazon Textract

Extraire facilement du texte et des données de pratiquement n'importe quel document
Amazon Textract est un service de machine learning entièrement géré qui extrait automatiquement du texte et des données à partir de documents numérisés. Il va au-delà de la simple reconnaissance optique des caractères (optical character recognition, OCR) pour identifier, comprendre et extraire les données de formulaires et autres tables.

Actuellement, beaucoup d’entreprises actuelles extraient des données à partir de documents numérisés, notamment des fichiers PDF, des tables et des formulaires, en recourant à la saisie manuelle de données (lente, chère et sujette aux erreurs) ou à des logiciels d’OCR simples qui requièrent une configuration manuelle qu’il faut mettre à jour pour chaque formulaire pour qu’ils restent fonctionnels.
 
Pour éliminer ces processus manuels, Textract utilise le machine learning pour lire et traiter instantanément tout type de document, extraire de manière précise le texte, les formulaires, les tableaux et d’autres données sans avoir à recourir à des opérations manuelles ou à du code personnalisé.

Grâce à Textract, vous pouvez rapidement automatiser les activités manuelles sur les documents, ce qui vous permet de traiter des millions de pages de documents en quelques heures. Une fois les informations capturées, vous pouvez agir dessus dans vos applications métier pour passer aux étapes suivantes d'une demande de prêt, d'un document fiscal, d'un formulaire d’inscription ou du traitement des dossiers de remboursement de frais médicaux. De plus, vous pouvez créer des index de recherche intelligents ou ajouter la vérification humaine avec Amazon Augmented AI pour évaluer les données nuancées ou sensibles.

Avantages

Extraction rapide et précise de données structurées ou non

Amazon Textract utilise l’intelligence artificielle pour « lire »les documents comme une personne physique, extraire du texte mais aussi des tableaux, des formulaires et d’autres donnée structurées sans configuration, formation ni code personnalisé. Amazon Textract détecte automatiquement la mise en page d'un document et les éléments clés de la page, comprend les relations de données dans les formulaires ou les tableaux incorporés et extrait tout avec son contexte intact.

Au-delà de la simple reconnaissance optique des caractères (OCR)

Amazon Textract utilise la technologie OCR pour identifier les étiquettes et les valeurs de formulaire, et extrait des informations à partir de tableaux sans compromettre la structure, et ce, à bas coût. Vous ne payez que ce que vous consommez, sans engagement initial ni contrat à long terme. 

Sécurité et conformité

Textract peut être utilisé pour les charges de travail soumises à la conformité du Service Organization Control (SOC), de l'Organisation internationale de normalisation (ISO), aux normes PCI, HIPAA et RGPD. Les clients de la finance, de la santé et d'autres secteurs peuvent avoir un aperçu des processus et des contrôles de sécurité qui protègent les données de leurs clients. Textract prend également en charge les points de terminaison Amazon Virtual Private Cloud (Amazon VPC) via AWS PrivateLink, ce qui permet aux clients de lancer en toute sécurité des appels API vers Amazon Textract depuis leur VPC et d'éviter d'utiliser l'Internet public.

Mise en place facile de la vérification humaine

Amazon Textract s'intègre directement à Amazon Augmented AI (Amazon A2I), ce qui vous permet de facilement mettre en place la vérification humaine du texte extrait de documents. Vous pouvez intégrer des vérifications humaines pour gérer des flux de travail nuancés ou sensibles qui nécessitent un jugement humain afin d'obtenir des prévisions hautement fiables ou d'auditer des prévisions de manière continue.

Qu’est-ce qu'Amazon Textract ? (1:49)

Cas d'utilisation

Créer des index de recherche intelligents

Extrayez des données structurées à partir de documents et créez un index intelligent pour pouvoir effectuer une recherche rapide à travers des millions d'états financiers. Par exemple, une société de crédit hypothécaire pourrait utiliser Amazon Textract pour traiter des millions de demandes de prêt numérisées en quelques heures et indexer les données extraites dans Amazon Elasticsearch. Cela leur permettrait de créer des expériences de recherche telles que la « recherche de demandes de prêt lorsque le nom du demandeur est John Doe » ou « les contrats de recherche où le taux d'intérêt est de 2 % ».

Créer des flux de travail de traitement de documents automatisés

Amazon Textract peut fournir les entrées nécessaires au traitement automatique des formulaires sans intervention humaine. Par exemple, les banques peuvent automatiser la gestion des demandes de prêt à l'aide d'Amazon Textract. Les informations contenues dans le document pourraient être utilisées pour initier toutes les vérifications nécessaires des antécédents et du crédit afin d'approuver le prêt et afin que les clients puissent obtenir des résultats instantanés de leur demande plutôt que d'attendre plusieurs jours pour une vérification et une validation manuelles.

Maintenir la conformité dans les archives de documents

Il devient facile de maintenir la conformité avec les contrôles d'informations étant donné qu'Amazon Textract identifie automatiquement les types de données et les étiquettes de formulaire. Par exemple, un assureur pourrait utiliser Amazon Textract pour alimenter un flux de travail qui rédige automatiquement des informations d'identification personnelle (PII) à des fins de vérification, avant d'archiver les formulaires de réclamation en reconnaissant automatiquement les paires clé-valeur importantes nécessitant une protection.

Témoignages de réussite

machine leanring_kabbage logo

Kabbage est une société de données et technologique qui fournit aux petites entreprises des solutions de trésorerie, notamment l'accès à des lignes de crédit flexibles, des paiements en ligne, des informations sur les flux de trésorerie et des comptes courants d'entreprise.

« Amazon Textract nous a permis d'aider 80 % des demandeurs de partenariat public-privé (PPP) à bénéficier d'une expérience de prêt entièrement automatisée et de réduire les délais d'approbation de plusieurs jours à une vitesse médiane de 4 heures. À la fin du programme, nous sommes devenus le deuxième prêteur PPP du pays en termes de volume de demandes, dépassant les grandes banques américaines, servant plus de 297 000 petites entreprises, et préservant environ 945 000 emplois dans toute l'Amérique. »

Anthony Sabelli, responsable de la science des données de Kabbage



change-healthcare-600x400

Change Healthcare est une grande entreprise de technologies médicales indépendante qui fournit des solutions de données et d'analyse pour améliorer les résultats cliniques, financiers et d'engagement client dans le système de soins de santé aux États-Unis.

« Chez Change Healthcare, nous pensons pouvoir rendre la santé abordable et accessible à tous en améliorant la rapidité et la qualité des décisions financières et administratives. Cet objectif peut être atteint grâce au pouvoir de la technologie du machine learning, qui nous aiderait à mieux comprendre nos données. Cependant, débloquer le potentiel de ces informations s'avère souvent difficile étant donné que celles-ci sont isolées dans des tableaux et des formulaires que la reconnaissance optique de caractères classique n'est pas en mesure d'analyser. Amazon Textract réalise des progrès en matière de compréhension des documents grâce à sa capacité à récupérer des données structurées en plus du texte. En outre, étant donné que le service est désormais conforme à a loi HIPAA, nous allons pouvoir libérer les informations de millions de documents et créer encore plus de valeur pour nos patients, nos payeurs et nos fournisseurs. »

Nick Giannasi, vice-président exécutif et responsable de l'IA chez Change Healthcare


filevine-600x400

Filevine est le noyau opérationnel pour les professionnels du droit, y compris la gestion des affaires et des dossiers dans le cloud, la gestion des documents et l'analyse approfondie des rapports. Dès son lancement en 2015, Filevine s'est concentré sur l'innovation rapide et la conception primée, obtenant les meilleures notes des sites d'évaluation indépendants.

« Des millions d'affaires et de dossiers sont traités chaque jour dans Filevine. Nous avons choisi Amazon Web Services parce que nous voulions offrir à nos clients les meilleures solutions de recherche de documents de leur catégorie. Amazon Textract est rapide, précis et évolutif ; il aide Filevine à répondre aux exigences des organisations juridiques les plus importantes et les plus élaborées du monde. Avec Filevine et Amazon, il n'a jamais été aussi facile pour les professionnels du droit de trouver cette fameuse aiguille dans une botte de foin ».

Ryan Anderson, président-directeur général de Filevine


Product-Page_Standard-Icons_01_Product-Features_SqInk
Découvrir les fonctions d'Amazon Textract

Découvrez davantage de fonctionnalités Amazon Textract.

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencer à créer sur la console

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire