Amazon Textract

Extraire facilement du texte et des données de pratiquement n'importe quel document
Amazon Textract est un service qui extrait automatiquement du texte et des données depuis des documents scannés. Amazon Textract est plus qu'un logiciel d'OCR (reconnaissance optique des caractères), car il identifie également le contenu des champs de formulaire et les informations stockées dans les tableaux.

Aujourd'hui, de nombreuses entreprises extraient des données de documents et de formulaires à l'aide d'une saisie manuelle de données qui est lente et coûteuse, ou à l'aide d'un simple logiciel de reconnaissance optique de caractères (OCR) qui nécessite une personnalisation ou une configuration manuelle. Les règles et les flux de travail pour chaque document et formulaire doivent souvent être programmés en dur et mis à jour lors de chaque modification du formulaire ou lorsque plusieurs formulaires sont utilisés. Si le formulaire diffère des règles, la sortie est souvent brouillée et inutilisable.

Amazon Textract surmonte ces défis en utilisant l'apprentissage automatique pour « lire » instantanément presque tous les types de documents afin d'extraire précisément le texte et les données sans recourir à un effort manuel ou à un code personnalisé. Avec Textract, vous pouvez automatiser les systèmes de documents rapidement, ce qui vous permet de traiter des millions de pages de documents par heures. Une fois que l'information est capturée, vous pouvez prendre des mesures à ce sujet dans vos applications métiers pour initier les étapes suivantes pour une demande de prêt ou le traitement des demandes de remboursement pour frais médicaux. De plus, vous pouvez créer des index de recherche intelligents, construire des flux de travail d'approbation automatisés et mieux maintenir la conformité avec les règles d'archivage de documents en signalant les données pouvant nécessiter une rédaction.

Présentation d'Amazon Textract (3:04)

Avantages

Extraire les données rapidement et avec précision

Amazon Textract facilite l'extraction rapide et précise des données de documents, de formulaires et de tableaux. Amazon Textract détecte automatiquement la mise en page d'un document et les éléments clés de la page, comprend les relations de données dans les formulaires ou les tableaux incorporés et extrait tout avec son contexte intact. Cela signifie que vous pouvez utiliser instantanément les données extraites dans une application ou les stocker dans une base de données sans beaucoup de code compliqué.



Aucun code ou modèle à maintenir

Les modèles d'apprentissage automatique préformés d'Amazon Textract éliminent la nécessité d'écrire le code pour l'extraction de données, car ils ont déjà été formés sur des dizaines de millions de documents venant de pratiquement tous les secteurs, notamment des contrats, des documents fiscaux, des commandes clients, des formulaires d'inscription, des demandes de prestations, des réclamations d'assurance, des documents de police et beaucoup d'autres. Vous n'avez plus besoin de gérer le code de chaque document ou formulaire que vous pourriez recevoir, ni de vous inquiéter du changement de la mise en page avec le temps.

Réduction des coûts de traitement des documents

Amazon Textract propose l'OCR et l'extraction de données structurées (formulaires et tableaux) à un coût très bas, et vous ne payez que ce que vous utilisez. Le service est offert sans engagement initial ni contrat à long terme. Vous pouvez facilement traiter des millions de documents à l'aide des API d'extraction de texte d'Amazon Textract.

Cas d'utilisation

Créer des index de recherche intelligents

Extrayez des données structurées à partir de documents et créez un index intelligent pour pouvoir effectuer une recherche rapide à travers des millions d'états financiers. Par exemple, une société de crédit hypothécaire pourrait utiliser Amazon Textract pour traiter des millions de demandes de prêt numérisées en quelques heures et indexer les données extraites dans Amazon Elasticsearch. Cela leur permettrait de créer des expériences de recherche telles que la « recherche de demandes de prêt lorsque le nom du demandeur est John Doe » ou « les contrats de recherche où le taux d'intérêt est de 2 % ».

Créer des flux de travail de traitement de documents automatisés

Amazon Textract peut fournir les entrées nécessaires au traitement automatique des formulaires sans intervention humaine. Par exemple,les banques peuvent automatiser la gestion des demandes de prêt à l'aide d'Amazon Textract. Les informations contenues dans le document pourraient être utilisées pour initier toutes les vérifications nécessaires des antécédents et du crédit afin d'approuver le prêt et afin que les clients puissent obtenir des résultats instantanés de leur demande plutôt que d'attendre plusieurs jours pour une vérification et une validation manuelles.

Maintenir la conformité dans les archives de documents

Il devient facile de maintenir la conformité avec les contrôles d'informations étant donné qu'Amazon Textract identifie automatiquement les types de données et les étiquettes de formulaire. Par exemple, un assureur pourrait utiliser Amazon Textract pour alimenter un flux de travail qui rédige automatiquement des informations d'identification personnelle (PII) à des fins de vérification, avant d'archiver les formulaires de réclamation en reconnaissant automatiquement les paires clé-valeur importantes nécessitant une protection.

Témoignages de réussite

600x400-cambia-health-solutions_logo

Cambia Health Solutions est une société de solutions de santé complète et l'entreprise parente de six mutuelles régionales, dont Regence, un organisme d'assurance qui compte plus de 2,6 millions d'adhérents en Oregon, en Idaho, en Utah et à Washington.

« Chez Cambia, nous nous consacrons depuis plus de 100 ans à l'amélioration des soins de santé des individus et de leurs familles. Pour réussir à atteindre cet objectif, nous avons toujours évalué les nouvelles innovations et opportunités d'optimisation de la coordination des soins. L'un des domaines prioritaires est la rationalisation des processus administratifs qui demandent beaucoup de temps et de travail. Nous sommes impatients de découvrir comment Amazon Textract va nous aider à automatiser le processus d'extraction des données importantes des formulaires papiers de manière précise et efficace. La combinaison puissante des sciences des données, de l'IA et d'une approche centrée sur l'humain est la clé de notre mission de transformation du système de soins de santé. »

Faraz Shafiq, responsable de l'intelligence artificielle chez Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare est une grande entreprise de technologies médicales indépendante qui fournir des solutions centrées sur les données et l'analyse pour améliorer les résultats cliniques, financiers et d'engagement client dans le système de soins de santé aux États-Unis.

« Chez Change Healthcare, nous pensons pouvoir rendre la santé abordable et accessible à tous en améliorant la rapidité et la qualité des décisions financières et administratives. Cet objectif peut être atteint grâce au pouvoir de la technologie du machine learning, qui nous aiderait à mieux comprendre nos données. Cependant, débloquer le potentiel de ces informations s'avère souvent difficile étant donné que celles-ci sont isolées dans des tableaux et des formulaires que la reconnaissance optique de caractères classique n'est pas en mesure d'analyser. Amazon Textract réalise des progrès en matière de compréhension des documents grâce à sa capacité à récupérer des données structurées en plus du texte. En outre, étant donné que le service est désormais conforme à a loi HIPAA, nous allons pouvoir libérer les informations de millions de documents et créer encore plus de valeur pour nos patients, nos payeurs et nos fournisseurs. »

Nick Giannasi, vice-président exécutif et responsable de l'IA chez Change Healthcare


CD_2018_Primary_Logo_w_TM

La plateforme innovante de solutions et de services de ClearDATA protège ses clients contre les risques liés à la confidentialité des données, améliore leur gestion des données et adapte leur infrastructure informatique de soins de santé, permettant à l'industrie de se concentrer sur la qualité des soins de santé en améliorant les services de soins jour après jour.

« Nous sommes ravis de voir qu'AWS ajoute son service de reconnaissance optique de caractères alimenté par le machine learning, Textract, à sa liste de services conformes à la loi HIPAA. De nombreuses données médicales qui sont partagées entre les payeurs et les prestataires sont bloquées dans des fichiers images, comme des PDF. Plutôt que de traiter manuellement ce type de données, les organisations de santé peuvent désormais utiliser le service Amazon Textract pour extraire les données médicales de fichiers qui étaient jusqu'ici non lisibles par machine. Elles peuvent ainsi intégrer ces données à leurs dossiers de santé électroniques ou à d'autres technologies de cloud telles qu'Amazon Comprehend Medical, qui peut identifier les informations de santé protégées dans les ensembles de données. Il ne s'agit que d'une nouvelle avancée en matière d'utilisation de ces technologies émergentes pour améliorer l'accès aux données, obtenir de meilleures informations, réduire les coûts et améliorer les expériences des patients et des membres. »

Matt Ferrari, responsable de la technologie chez ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Découvrir les fonctionnalités d'Amazon Textract

Découvrez davantage de fonctionnalités Amazon Textract.

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencer à créer sur la console

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire