Automatiser le traitement des données à partir de documents

Améliorez la productivité des employés et prenez des décisions plus rapidement grâce au traitement intelligent des documents

Les organisations de tous les secteurs, y compris des services financiers et des soins de santé, disposent d'un grand nombre de documents qui nécessitent un certain traitement. Ces documents, tels que les factures, les formulaires des patients, les demandes de prêt et les contrats, contiennent des données telles que les noms des personnes à l'origine des demandes, les entités (lieux ou marques) ou l'historique de santé des patients, qui sont essentielles à leurs processus métier.

Toutes ces données doivent être extraites de documents numériques pour effectuer des tâches comme traiter les demandes de prêt, analyser le sentiment des clients, déterminer les traitements des patients ou filtrer les achats non conformes des factures. Aujourd'hui, les organisations dépensent des millions chaque année en efforts manuels pour ces opérations qui sont chronophages, sujettes aux erreurs, coûteuses et dont la mise à l'échelle reste difficile.

Pour aider à surmonter ces défis, AWS propose des solutions de traitement de documents intelligentes, optimisés par le machine learning. Vous pouvez extraire du texte de millions de documents, comprendre le sentiment ou les relations entre ces documents, et même inclure une étape humaine pour valider, corriger ou augmenter les résultats du machine learning pour vous assurer une plus grande précision et plus de conformité.

Automatiser l'extraction et l'analyse des données à partir de documents avec le machine learning (2:41)

Avantages

Offrez de meilleures expériences personnalisées

Une plus grande précision des données

L'utilisation du ML peut vous aider à traiter les documents avec plus de rapidité et de précision, en réduisant le nombre d'erreurs causées par la saisie manuelle. Dans les cas où les données doivent être d'une précision absolue, vous pouvez intervenir à tout moment et examiner les données.

Améliorer l'engagement client

Un traitement des données plus rapide

Grâce à la mise en œuvre d'un traitement intelligent des documents, vous pourrez effectuer les tâches qui vous prenaient auparavant plusieurs semaines ou mois en quelques jours.

Personnaliser chaque point d'accès

Une meilleure productivité des employés

Le machine learning supprime le traitement manuel qui consiste à extraire des informations des documents et à saisir des informations dans divers systèmes. Ainsi, vos employés peuvent consacrer davantage temps aux tâches métiers à valeur ajoutée.

Personnaliser chaque point d'accès

Réduction des coûts

L'automatisation des flux de travail documentaire réduit la complexité de l'extraction
et de l'analyse des données, réduisant ainsi le coût moyen par document.

Témoignages de clients

Pulselive
« Nous nous efforçons de combiner la technologie et l'expertise pour aider nos clients à comprendre les données de leur chaîne logistique. Pour ce faire, nous avions besoin d'une solution pour fournir une classification en temps réel des documents de conformité de forme libre à grande échelle. Notre processus consiste à extraire du texte semi-structuré des images et des documents PDF contenant des formulaires et des tableaux, ainsi qu'à extraire des entités personnalisées dans ces documents. La technologie de reconnaissance optique de caractères (OCR) d'Amazon Textract nous a permis de traiter les documents tandis qu'Amazon Comprehend a pu extraire les entités personnalisées. Nous avons également eu besoin d'intégrer des personnes dans notre processus. Grâce à Amazon Augmented AI (Amazon A2I), nous avons pu demander à nos équipes d'examiner des documents dans une plage de précision donnée et de nous aider à entraîner notre prochaine itération de modèle. La combinaison de ces services avec AppSync et Amplify nous a fourni des informations plus précises sur les risques liés à la chaîne d'approvisionnement de nos clients dans un laps de temps plus court, ce qui a permis à ces derniers de gagner des centaines d'heures dans la révision manuelle des documents. Ils peuvent désormais obtenir un retour d'information immédiat pour savoir si leur entreprise est exposée à un risque de non-conformité. »

Corey Peters, Développeur logiciels senior – Assent Compliance

Lotte Mart
« Depuis plus de 25 ans, nous développons des capacités avancées de machine learning afin d'extraire, de connecter, d'améliorer, d'organiser et de diffuser des informations à nos clients, dans le but de leur permettre de simplifier leur travail et d'en tirer plus de valeur. Avec Amazon SageMaker, nous avons pu concevoir une fonction de traitement du langage naturel dans le cadre d'une application de question-réponse. Notre solution a nécessité plusieurs itérations de configurations de deep learning à grande échelle en utilisant les capacités d'Amazon SageMaker. »

Khalid Al-Kofahi, Intelligence artificielle et informatique cognitive – Thomson Reuters Center

Lotte Mart
« Amazon Textract nous a permis d'aider 80 % des demandeurs de partenariat public-privé (PPP) à bénéficier d'une expérience de prêt entièrement automatisée et de réduire les délais d'approbation de plusieurs jours à une vitesse médiane de 4 heures. À la fin du programme, nous sommes devenus le deuxième prêteur PPP du pays en termes de volume de demandes, dépassant les grandes banques américaines, servant plus de 297 000 petites entreprises, et préservant environ 945 000 emplois dans toute l'Amérique. »

Anthony Sabelli, Responsable de la science des données – Kabbage

Lotte Mart
« Nos équipes traitent et vérifient annuellement un nombre colossal de documents financiers afin de fournir des prêts et des baux à nos clients. Dans certains cas, les documents de financement requis peuvent être incohérents ou mal numérisés. Grâce à Amazon Augmented AI (A2I) et Amazon Textract, nous pouvons réduire le temps consacré à l'examen les documents de 80 % », a déclaré Matthew Lewis, Directeur informatique chez Dealnet Capital. « La capacité d'auditer l'exactitude du texte extrait de tous nos documents financiers à grande échelle à l'aide de flux de travail d'examen humain avec A2I nous conforte dans l'idée que nos systèmes optimisés par le machine learning offrent la plus haute qualité possible pour respecter nos normes strictes en matière de vérification des documents et de conformité. »

Matthew Lewis, Directeur informatique – Dealnet Capital

Choisissez la solution adaptée à vos besoins

AWS propose plusieurs approches flexibles que vous pouvez utiliser pour mettre en œuvre une solution de traitement de documents intelligente basée sur le machine learning afin d'extraire, de traiter et d'analyser automatiquement les données des documents qui favorise le développement de votre entreprise. Pour les organisations qui souhaitent se lancer aujourd'hui avec des solutions de traitement de documents intelligentes pré-entraînées, AWS propose des services entièrement gérés tels qu'Amazon Textract, Amazon Comprehend et Amazon A2I. Combinés ou utilisés séparément, ces services AWS sont un excellent moyen de réduire les coûts et les efforts manuels, et d'améliorer vos résultats métier. Les organisations qui souhaitent développer leurs propres modèles de machine learning pour le traitement intelligent des documents peuvent utiliser Amazon SageMaker, un service entièrement géré qui aide les scientifiques des données et les développeurs ML à créer, entraîner et déployer rapidement leurs propres modèles de machine learning. Quelle que soit l'option que vous choisissez, Amazon SageMaker fournit tous les outils dont vous avez besoin pour le machine learning de bout en bout afin que vous puissiez facilement développer des modèles de traitement de texte de haute qualité.

Amazon Textract

Amazon Textract est un service de machine learning entièrement géré qui extrait automatiquement l'écriture manuscrite, le texte imprimé et les données des documents numérisés. Ce service va bien au-delà de la traditionnelle technologie de reconnaissance optique de caractères (OCR), dont la configuration manuelle doit être mise à jour chaque fois qu'un formulaire est modifié, en extrayant avec précision du texte, des formulaires, des tableaux et d'autres données sans nécessiter d'effort manuel ou de code personnalisé. Grâce à Textract, vous pouvez rapidement automatiser les activités manuelles sur les documents, ce qui vous permet de traiter des millions de pages de documents en quelques heures. Une fois les informations capturées, vous pouvez les exploiter dans vos applications métier pour passer aux étapes suivantes d'une demande de prêt, d'un document fiscal, d'un formulaire d'inscription ou du traitement des dossiers de remboursement de frais médicaux.

En savoir plus sur Amazon Textract » 

Amazon Comprehend

Amazon Comprehend est un service de traitement du langage naturel (NLP) qui exploite le machine learning pour identifier des informations et des relations dans un texte. Le service identifie la langue du texte, extrait les phrases clés, les lieux, les personnes ou les marques, comprend le sentiment qui se dégage du texte et organise automatiquement une collection de fichiers texte par thème. Vous pouvez entraîner Amazon Comprehend à identifier les entités pertinentes pour votre organisation, telles que les noms de produit, les numéros de pièce, les noms de service, etc. Vous pouvez également entraîner Amazon Comprehend à classifier les documents ou à attribuer des étiquettes pertinentes au texte.

En savoir plus sur Amazon Comprehend »

Amazon Comprehend Medical

Amazon Comprehend Medical est un service de traitement de langage naturel qui facilite l'utilisation du machine learning pour extraire des informations médicales pertinentes d'un texte non structuré, conçu spécifiquement pour les clients du secteur de la santé. Grâce à Amazon Comprehend Medical, vous pouvez collecter rapidement et avec précision des informations telles que l'état de santé, les médicaments, la posologie, la concentration et la fréquence de différentes sources : les notes du médecin, les rapports d'essais cliniques et les dossiers médicaux des patients. Amazon Comprehend Medical peut également associer les informations détectées à des ontologies médicales telles qu'ICD-10-CM ou RxNorm afin de pouvoir les utiliser facilement avec les applications de soins de santé en aval.

En savoir plus sur Amazon Comprehend Medical »

Amazon A2I

Amazon Augmented AI (Amazon A2I) facilite la création et la gestion des vérifications humaines pour les applications de machine learning. Amazon A2I fournit des flux de travail intégrant l'analyse humaine pour les utilisations courantes de machine learning, tels que l'extraction de texte à partir de documents. À l'aide d'Amazon A2I, vous pouvez envoyer n'importe quel document à une personne pour examen afin de vous assurer que le texte, la phrase ou les informations sont traités correctement. En outre, vous pouvez utiliser ces informations d'examen humain pour ré-entraîner votre modèle de machine learning afin de garantir la précision en aval.

En savoir plus sur Amazon A2I »

Amazon SageMaker

Amazon SageMaker est un service entièrement géré qui offre à chaque développeur et scientifique des données la possibilité de créer, d'entraîner et de déployer rapidement des modèles de machine learning. SageMaker facilite chaque étape du machine learning afin de rendre plus aisé le développement de modèles de haute qualité. SageMaker propose plusieurs algorithmes de machine learning intégrés, tels que BlazingText et Linear Learner, optimisés pour la classification de texte, le traitement du langage naturel (NLP) et la reconnaissance optique de caractères (OCR), que vous pouvez facilement utiliser pour entraîner et déployer des modèles. Vous pouvez également intégrer votre propre algorithme ou modèle de traitement de texte, tel que modèle de langage populaire BERT (Bidirectional Encoder Representations from Transformers) à Amazon SageMaker ou choisir parmi les centaines d'algorithmes et de modèles pré-entraînés disponibles sur AWS Marketplace. Avec SageMaker Autopilot, les entreprises peuvent en outre utiliser les fonctionnalités de machine learning automatisé (AutoML) pour générer facilement des modèles de traitement de texte. Avec l'une de ces options, SageMaker fournit tous les composants dont vous avez besoin pour le machine learning, y compris le premier environnement de développement entièrement intégré (IDE) pour le machine learning afin de permettre aux équipes de développer et partager des modèles ML, ainsi que de faciliter la collaboration entre les équipes de science des données, le tout depuis dans une seule interface. SageMaker offre aux organisations un accès, un contrôle et une visibilité complets sur chaque étape du flux de travail ML, y compris une surveillance continue des problèmes de qualité et des alertes en cas de détection de problèmes. SageMaker aide les équipes à mettre les modèles ML en production plus rapidement avec beaucoup moins d'efforts et à moindre coût, avec la possibilité d'améliorer continuellement leurs modèles.

En savoir plus sur Amazon SageMaker »

Ressources

Apprenez à surmonter les défis liés au traitement et à l'analyse de documents à grande échelle grâce au machine learning

Regarder le webinaire »

Création d'une solution de traitement de documents intelligente de bout en bout à l'aide d'AWS

Lire le blog »

En savoir plus sur la solution DUS (Document Understanding)

Consultez le référentiel GitHub »

Prêt à vous lancer ?

Contacter le service commercial
Contactez-nous

Contactez-nous pour en savoir plus sur les solutions de machine learning pour le traitement intelligent des documents

Contactez-nous 
Faites vos premiers pas en mettant en place des initiatives
Faites vos premiers pas en mettant en œuvre vos initiatives de traitement de documents

L'organisation AWS Professional Services est constituée d'une équipe mondiale d'experts en mesure de vous aider à obtenir les résultats métiers escomptés en utilisant le Cloud AWS.

En savoir plus 
Rechercher un partenaire
Rechercher un partenaire

Contactez le Réseau Partenaires AWS pour collaborer avec nos partenaires consultants et technologiques mondiaux

Mise en route