Amazon Textract

Extraire facilement du texte imprimé, une écriture manuscrite et des données de pratiquement n'importe quel document

Amazon Textract est un service de machine learning qui extrait automatiquement du texte, de l'écriture manuscrite et des données à partir de documents numérisés. Il va au-delà de la simple reconnaissance optique des caractères (OCR) pour identifier, comprendre et extraire les données de formulaires et de tables. De nos jours, de nombreuses entreprises extraient manuellement des données à partir de documents analysés, tels que les fichiers PDF, les images, les tableaux et formulaires, ou par l'intermédiaire de simples logiciels OCR. Cela requiert une configuration manuelle qui, souvent, doit être adaptée en fonction du formulaire. Pour éliminer ces processus manuels onéreux, Textract utilise le machine learning pour lire et traiter tout type de document, extraire de manière précise le texte, l'écriture manuscrite, les tableaux et d'autres données sans action manuelle. Vous pouvez rapidement automatiser le traitement des documents et intervenir sur les informations extraites, qu'il s'agisse de l'automatisation du traitement de prêts ou de documents fiscaux. Textract peut extraire les données en quelques minutes seulement. En outre, vous pouvez ajouter Amazon Augmented AI pour les vérifications humaines afin de superviser vos modèles et évaluer les données sensibles.

1 000 pages gratuites

par mois avec l'offre gratuite AWS

Avantages

Extraction de données structurées ou non

Amazon Textract utilise l'intelligence artificielle pour lire les documents comme le ferait une personne humaine, en extrayant du texte, des mises en page, des tableaux, des formulaires et d'autres données structurées avec contexte et sans configuration, formation ni code personnalisé.

Au-delà de la simple reconnaissance optique des caractères (OCR)

Amazon Textract utilise la technologie OCR pour identifier les étiquettes et les valeurs de formulaire, et extrait des informations à partir de tableaux sans compromettre la structure, et ce, à bas coût. Vous ne payez que ce que vous consommez, sans engagement initial ni contrat à long terme.

Sécurité et conformité des données

Amazon Textract est conforme aux normes Service Organization Control (SOC), International Organization for Standardization (ISO), ainsi qu'aux normes PCI, HIPAA et GDPR, ce qui signifie que les clients peuvent obtenir des informations détaillées sur les processus et les contrôles de sécurité qui protègent les données des clients. De plus, Textract prend en charge les points de terminaison Amazon Virtual Private Cloud (VPC) via AWS Privatelink et KMS, ce qui évite aux clients d'avoir à utiliser l'Internet public et de chiffrer leurs données.

Mise en place facile de la vérification humaine

Amazon Textract s'intègre directement à Amazon Augmented AI (Amazon A2I), ce qui vous permet de facilement mettre en place la vérification humaine du texte extrait de documents. Vous pouvez intégrer des vérifications humaines pour gérer des flux de travail nuancés ou sensibles qui nécessitent une supervision humaine afin d'obtenir des prévisions hautement fiables ou d'auditer des prévisions de manière continue.

Cas d'utilisation

Services financiers

Services financiers

Les formulaires financiers, tels que les demandes de prêt immobilier, les formulaires fiscaux (W-2), entre autres, peuvent contenir des informations critiques, telles que les taux d'emprunt, les noms des demandeurs et autres informations fiscales, qui doivent être extraites et analysées. Grâce à Amazon Textract, vous pouvez extraire des informations de documents, tableaux et formulaires analysés et traiter les demandes en quelques minutes afin de donner une réponse rapide à vos clients.

Santé et sciences de la vie

Santé et sciences de la vie

Amazon Textract peut scanner des milliers de formulaires médicaux et d'assurance, en extraire les informations tout en conservant leur contexte d'origine, afin de vous éviter de vérifier manuellement la sortie. Fournissez un service de meilleure qualité à vos patients et assureurs en extrayant des données importantes de formulaires médicaux, de déclarations de sinistres et de formulaires d'autorisation préalable.

Secteur public

Secteur public

Le traitement de formulaires du gouvernement, tels que les prêts aux petites entreprises, les formulaires fiscaux ou les candidatures exige des milliers d'heures pour en extraire les données pertinentes et importantes. Amazon Textract peut extraire toutes les données de ces documents, qu'il s'agisse d'images, de fichiers PDF ou de documents analysés à l'aide de la technologie OCR. Textract identifie non seulement le moindre caractère, mot ou lettre, mais le contenu des champs des formulaires et les informations présentes dans les tableaux avec une grande précision.

Témoignages de réussite

Kabbage

Kabbage est une société de données et de technologie qui fournit aux petites entreprises des solutions de trésorerie, notamment l'accès à des lignes de crédit flexibles, des paiements en ligne, des informations sur les flux de trésorerie et des comptes courants d'entreprise.

« Amazon Textract nous a permis d'aider 80 % des demandeurs de partenariat public-privé (PPP) à bénéficier d'une expérience de prêt entièrement automatisée et de réduire les délais d'approbation de plusieurs jours à une vitesse médiane de 4 heures. À la fin du programme, nous sommes devenus le deuxième prêteur PPP du pays en termes de volume de demandes, dépassant les grandes banques américaines, servant plus de 297 000 petites entreprises, et préservant environ 945 000 emplois dans toute l'Amérique. »

Anthony Sabelli, responsable de la science des données chez Kabbage

Change Healthcare

Change Healthcare est une société indépendante de premier plan dans le domaine des technologies de la santé qui fournit des données et des solutions analytiques pour améliorer les résultats cliniques, financiers et l'engagement des patients dans le système de santé américain.

« Chez Change Healthcare, nous pensons pouvoir rendre la santé abordable et accessible à tous en améliorant la rapidité et la qualité des décisions financières et administratives. Cet objectif peut être atteint grâce au pouvoir de la technologie du machine learning, qui nous aiderait à mieux comprendre nos données. Cependant, débloquer le potentiel de ces informations s'avère souvent difficile étant donné que celles-ci sont isolées dans des tableaux et des formulaires que la reconnaissance optique de caractères classique n'est pas en mesure d'analyser. Amazon Textract réalise des progrès en matière de compréhension des documents grâce à sa capacité à récupérer des données structurées en plus du texte. En outre, étant donné que le service est désormais conforme à la loi HIPAA, nous allons pouvoir libérer les informations de millions de documents et créer encore plus de valeur pour nos patients, nos payeurs et nos fournisseurs. »

Nick Giannasi, vice-président exécutif et responsable de l'IA chez Change Healthcare

Filevine

Filevine est le centre opérationnel des professionnels du droit, y compris de la gestion des dossiers et des matières dans le cloud, la gestion des documents et l'analyse approfondie des rapports. Dès son lancement en 2015, Filevine s'est concentré sur l'innovation rapide et la conception primée, obtenant les meilleures notes des sites d'évaluation indépendants.

« Des millions d'affaires et de dossiers sont traités chaque jour dans Filevine. Nous avons choisi Amazon Web Services parce que nous voulions offrir à nos clients les meilleures solutions de recherche de documents de leur catégorie. Amazon Textract est rapide, précis et évolutif ; il aide Filevine à répondre aux exigences des organisations juridiques les plus importantes et les plus élaborées du monde. Avec Filevine et Amazon, il n'a jamais été aussi facile pour les professionnels du droit de trouver cette fameuse aiguille dans une botte de foin ».

Ryan Anderson, président-directeur général de Filevine

Intuit

Intuit est fournisseur de solutions de gestion financière innovantes, dont TurboTax et QuickBooks, auprès d'environ 50 millions de clients dans le monde entier.

« La technologie de compréhension des documents d'Intuit utilise l'IA pour éviter à nos clients, petites entreprises et professionnels indépendants de saisir des données manuellement. Pour les millions d'Américains qui ont recours à TurboTax tous les ans, cette technologie simplifie la déclaration d'impôts en leur épargnant la saisie fastidieuse de données à partir de documents financiers. Textract représente une partie importante de la fonctionnalité d'analyse de documents d'Intuit en améliorant la précision d'extraction des données grâce à l'analyse de texte dans les formulaires financiers compliqués. »

Krithika Swaminathan, VP de l'IA chez Intuit

Standard Product Icons (Features) Squid Ink
Découvrir les fonctions d'Amazon Textract

Découvrez davantage de fonctionnalités Amazon Textract.

En savoir plus 
Sign up for a free account
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Standard Product Icons (Start Building) Squid Ink
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire