Amazon Textract

Extrayez facilement du texte et des données de pratiquement n'importe quel document

Amazon Textract est un service qui extrait automatiquement du texte et des données depuis des documents scannés. Amazon Textract est plus qu’un logiciel d’OCR (reconnaissance optique des caractères) car il identifie également le contenu des champs de formulaire et les informations stockées dans les tableaux.

Aujourd'hui, de nombreuses entreprises extraient des données de documents et de formulaires à l'aide d'une saisie manuelle de données qui est lente et coûteuse, ou à l'aide d'un simple logiciel de reconnaissance optique de caractères (OCR) qui est difficile à personnaliser. Les règles et les flux de travail pour chaque document et formulaire doivent souvent être programmés en dur et mis à jour lors de chaque modification du formulaire ou lors de l'utilisation de plusieurs formulaires. Si le formulaire diffère des règles, la sortie est souvent brouillée et inutilisable.

Amazon Textract surmonte ces défis en utilisant l'apprentissage automatique pour « lire » instantanément presque tous les types de documents afin d'extraire précisément le texte et les données sans recourir à un effort manuel ou à un code personnalisé. Avec Textract, vous pouvez automatiser les systèmes de documents rapidement, ce qui vous permet de traiter des millions de pages de documents par heures. Une fois que l'information est capturée, vous pouvez prendre des mesures à ce sujet dans vos applications métiers pour initier les étapes suivantes pour une demande de prêt ou le traitement des demandes de remboursement pour frais médicaux. De plus, vous pouvez créer des index de recherche intelligents, construire des flux de travail d'approbation automatisés et mieux maintenir la conformité avec les règles d'archivage de documents en signalant les données pouvant nécessiter une rédaction.

Présentation d’Amazon Textract

Avantages

Extraire les données rapidement et avec précision

Amazon Textract facilite l'extraction rapide et précise des données de documents et de formulaires. Amazon Textract détecte automatiquement la mise en page d'un document et les éléments clés de la page, comprend les relations de données dans les formulaires ou les tableaux incorporés et extrait tout avec son contexte intact. Cela signifie que vous pouvez utiliser instantanément les données extraites dans une application ou les stocker dans une base de données sans beaucoup de code compliqué.



Aucun code ou modèle à maintenir

Les modèles d'apprentissage automatique préformés d'Amazon Textract éliminent le besoin d'écrire le code pour l'extraction de données, car ils ont déjà été formés sur des dizaines de millions de documents venant de pratiquement tous les secteurs, notamment des factures, des reçus, des contrats, des documents fiscaux, des commandes clients, des formulaires d'inscription, des demandes de prestations, des réclamations d’assurance, des documents de police et beaucoup d’autres. Vous n'avez plus besoin de gérer le code de chaque document ou formulaire que vous pourriez recevoir, ni de vous inquiéter de la façon dont la mise en page pourrait changer avec le temps.

Réduction des coûts de traitement des documents

L'API d'extraction de texte d'Amazon Textract vous permet de traiter des documents pour 1,50 $ par 1 000 pages. Que vous traitiez quelques centaines ou des millions de documents par an, Amazon Textract propose OCR et l'extraction de données structurées (formulaires et tableaux) à un coût très bas, et vous n’avez pas à payer que ce que vous n’utilisez pas. Le service est offert sans engagement initial ni contrat à long terme.

Cas d'utilisation

Créer des index de recherche intelligents

Extrayez des données structurées à partir de documents et créez un index intelligent à l'aide d'Amazon Elasticsearch Service pour vous permettre d'effectuer une recherche rapide à travers des millions d'états financiers. Par exemple, une société de crédit hypothécaire pourrait utiliser Amazon Textract pour traiter des millions de demandes de prêt numérisées en quelques heures et indexer les données extraites dans Amazon Elasticsearch. Cela leur permettrait de créer des expériences de recherche telles que la « recherche de demandes de prêt lorsque le nom du demandeur est John Doe » ou « les contrats de recherche où le taux d'intérêt est de 2 % ».

Créer des flux de travail de traitement de documents automatisés

Amazon Textract peut fournir les entrées nécessaires au traitement automatique des formulaires sans intervention humaine. Par exemple, une banque pourrait écrire du code pour lire les PDF des demandes de prêt. Les informations contenues dans le document pourraient être utilisées pour initier toutes les vérifications nécessaires des antécédents et du crédit afin d’approuver le prêt et afin que les clients puissent obtenir des résultats instantanés de leur demande plutôt que d’attendre plusieurs jours pour une vérification et une validation manuelle.

Maintenir la conformité dans les archives de documents

Il devient facile de maintenir la conformité avec les contrôles d'informations étant donné qu'Amazon Textract identifie automatiquement les types de données et les étiquettes de formulaire. Par exemple, un assureur pourrait utiliser Amazon Textract pour alimenter un flux de travail qui rédige automatiquement des informations d'identification personnelle (PII) à des fins de vérification, avant d'archiver les formulaires de réclamation en reconnaissant automatiquement les paires clé-valeur importantes nécessitant une protection.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Découvrez les fonctionnalités d'Amazon Textract

En savoir plus sur la manière dont Amazon Textract détecte les paires clé-valeur, préserve les données tabulaires, et plus.

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
S'inscrire à la version préliminaire d'Amazon Textract

Commencez à créer avec Amazon Textract en vous inscrivant à la version préliminaire.

S'inscrire