Amazon Textract

Extraire facilement du texte et des données de pratiquement n'importe quel document
Amazon Textract est un service de machine learning entièrement géré qui extrait automatiquement du texte et des données à partir de documents numérisés. Il va au-delà de la simple reconnaissance optique des caractères (optical character recognition, OCR) pour identifier, comprendre et extraire les données de formulaires et autres tables.

Actuellement, beaucoup d’entreprises actuelles extraient des données à partir de documents numérisés, notamment des fichiers PDF, des tables et des formulaires, en recourant à la saisie manuelle de données (lente, chère et sujette aux erreurs) ou à des logiciels d’OCR simples qui requièrent une configuration manuelle qu’il faut mettre à jour pour chaque formulaire pour qu’ils restent fonctionnels.
 
Pour éliminer ces processus manuels, Textract utilise le machine learning pour lire et traiter instantanément tout type de document, extraire de manière précise le texte, les formulaires, les tableaux et d’autres données sans avoir à recourir à des opérations manuelles ou à du code personnalisé.

Grâce à Textract, vous pouvez rapidement automatiser les activités manuelles sur les documents, ce qui vous permet de traiter des millions de pages de documents en quelques heures. Une fois les informations capturées, vous pouvez agir dessus dans vos applications métier pour passer aux étapes suivantes d'une demande de prêt, d'un document fiscal, d'un formulaire d’inscription ou du traitement des dossiers de remboursement de frais médicaux. De plus, vous pouvez créer des index de recherche intelligents ou ajouter la vérification humaine avec Amazon Augmented AI pour évaluer les données nuancées ou sensibles.

Avantages

Extraction rapide et précise de données structurées ou non

Amazon Textract utilise l’intelligence artificielle pour « lire »les documents comme une personne physique, extraire du texte mais aussi des tableaux, des formulaires et d’autres donnée structurées sans configuration, formation ni code personnalisé. Amazon Textract détecte automatiquement la mise en page d'un document et les éléments clés de la page, comprend les relations de données dans les formulaires ou les tableaux incorporés et extrait tout avec son contexte intact.

Au-delà de la simple reconnaissance optique des caractères (OCR)

Amazon Textract utilise la technologie OCR pour identifier les étiquettes et les valeurs de formulaire, et extrait des informations à partir de tableaux sans compromettre la structure, et ce, à bas coût. Vous ne payez que ce que vous consommez, sans engagement initial ni contrat à long terme. 

Sécurité et conformité

Textract peut être utilisé pour les charges de travail sujettes à la conformité avec les normes Service Organization Control (SOC) et International Organization for Standardization (ISO), mais aussi PCI, HIPAA et RGPD, ce qui signifie que les clients du domaine de la finance, de la santé et bien d’autres peuvent profiter d’insights approfondis sur les processus et contrôles de sécurité qui protègent les données des clients.

Mise en place facile de la vérification humaine

Amazon Textract s'intègre directement à Amazon Augmented AI (Amazon A2I), ce qui vous permet de facilement mettre en place la vérification humaine du texte extrait de documents. Vous pouvez intégrer des vérifications humaines pour gérer des flux de travail nuancés ou sensibles qui nécessitent un jugement humain afin d'obtenir des prévisions hautement fiables ou d'auditer des prévisions de manière continue.

Qu’est-ce qu'Amazon Textract ? (1:49)

Cas d'utilisation

Créer des index de recherche intelligents

Extrayez des données structurées à partir de documents et créez un index intelligent pour pouvoir effectuer une recherche rapide à travers des millions d'états financiers. Par exemple, une société de crédit hypothécaire pourrait utiliser Amazon Textract pour traiter des millions de demandes de prêt numérisées en quelques heures et indexer les données extraites dans Amazon Elasticsearch. Cela leur permettrait de créer des expériences de recherche telles que la « recherche de demandes de prêt lorsque le nom du demandeur est John Doe » ou « les contrats de recherche où le taux d'intérêt est de 2 % ».

Créer des flux de travail de traitement de documents automatisés

Amazon Textract peut fournir les entrées nécessaires au traitement automatique des formulaires sans intervention humaine. Par exemple, les banques peuvent automatiser la gestion des demandes de prêt à l'aide d'Amazon Textract. Les informations contenues dans le document pourraient être utilisées pour initier toutes les vérifications nécessaires des antécédents et du crédit afin d'approuver le prêt et afin que les clients puissent obtenir des résultats instantanés de leur demande plutôt que d'attendre plusieurs jours pour une vérification et une validation manuelles.

Maintenir la conformité dans les archives de documents

Il devient facile de maintenir la conformité avec les contrôles d'informations étant donné qu'Amazon Textract identifie automatiquement les types de données et les étiquettes de formulaire. Par exemple, un assureur pourrait utiliser Amazon Textract pour alimenter un flux de travail qui rédige automatiquement des informations d'identification personnelle (PII) à des fins de vérification, avant d'archiver les formulaires de réclamation en reconnaissant automatiquement les paires clé-valeur importantes nécessitant une protection.

Témoignages de réussite

600x400-cambia-health-solutions_logo

Cambia Health Solutions est une société de solutions de santé complète et l'entreprise parente de six mutuelles régionales, dont Regence, un organisme d'assurance qui compte plus de 2,6 millions d'adhérents en Oregon, en Idaho, en Utah et à Washington.

« Chez Cambia, nous nous consacrons depuis plus de 100 ans à l'amélioration des soins de santé des individus et de leurs familles. Pour réussir à atteindre cet objectif, nous avons toujours évalué les nouvelles innovations et opportunités d'optimisation de la coordination des soins. L'un des domaines prioritaires est la rationalisation des processus administratifs qui demandent beaucoup de temps et de travail. Nous sommes impatients de découvrir comment Amazon Textract va nous aider à automatiser le processus d'extraction des données importantes des formulaires papiers de manière précise et efficace. La combinaison puissante des sciences des données, de l'IA et d'une approche centrée sur l'humain est la clé de notre mission de transformation du système de soins de santé. »

Faraz Shafiq, responsable de l'intelligence artificielle chez Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare est une grande entreprise de technologies médicales indépendante qui fournir des solutions centrées sur les données et l'analyse pour améliorer les résultats cliniques, financiers et d'engagement client dans le système de soins de santé aux États-Unis.

« Chez Change Healthcare, nous pensons pouvoir rendre la santé abordable et accessible à tous en améliorant la rapidité et la qualité des décisions financières et administratives. Cet objectif peut être atteint grâce au pouvoir de la technologie du machine learning, qui nous aiderait à mieux comprendre nos données. Cependant, débloquer le potentiel de ces informations s'avère souvent difficile étant donné que celles-ci sont isolées dans des tableaux et des formulaires que la reconnaissance optique de caractères classique n'est pas en mesure d'analyser. Amazon Textract réalise des progrès en matière de compréhension des documents grâce à sa capacité à récupérer des données structurées en plus du texte. En outre, étant donné que le service est désormais conforme à a loi HIPAA, nous allons pouvoir libérer les informations de millions de documents et créer encore plus de valeur pour nos patients, nos payeurs et nos fournisseurs. »

Nick Giannasi, vice-président exécutif et responsable de l'IA chez Change Healthcare


CD_2018_Primary_Logo_w_TM

La plateforme innovante de solutions et de services de ClearDATA protège ses clients contre les risques liés à la confidentialité des données, améliore leur gestion des données et adapte leur infrastructure informatique de soins de santé, permettant à l'industrie de se concentrer sur la qualité des soins de santé en améliorant les services de soins jour après jour.

« Nous sommes ravis de voir qu'AWS ajoute son service de reconnaissance optique de caractères alimenté par le machine learning, Textract, à sa liste de services conformes à la loi HIPAA. De nombreuses données médicales qui sont partagées entre les payeurs et les prestataires sont bloquées dans des fichiers images, comme des PDF. Plutôt que de traiter manuellement ce type de données, les organisations de santé peuvent désormais utiliser le service Amazon Textract pour extraire les données médicales de fichiers qui étaient jusqu'ici non lisibles par machine. Elles peuvent ainsi intégrer ces données à leurs dossiers de santé électroniques ou à d'autres technologies de cloud telles qu'Amazon Comprehend Medical, qui peut identifier les informations de santé protégées dans les ensembles de données. Il ne s'agit que d'une nouvelle avancée en matière d'utilisation de ces technologies émergentes pour améliorer l'accès aux données, obtenir de meilleures informations, réduire les coûts et améliorer les expériences des patients et des membres. »

Matt Ferrari, responsable de la technologie chez ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Découvrir les fonctionnalités d'Amazon Textract

Découvrez davantage de fonctionnalités Amazon Textract.

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencer à créer sur la console

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire