Amazon Textract est un service de machine learning (ML) qui extrait automatiquement le texte, l'écriture manuscrite et les données des documents numérisés. Il va au-delà de la simple reconnaissance optique de caractères (OCR) pour identifier, comprendre et extraire les données des formulaires et des tableaux. Avec Amazon Textract, vous ne payez que ce que vous utilisez. Il n'y a pas de frais minimums et aucun engagement initial n'est requis. Amazon Textract est facturé uniquement pour les pages traitées, que vous extrayiez du texte seul, du texte avec des tableaux, des données de formulaire, des requêtes ou que vous traitiez des factures et des documents d’identité. Consultez les questions fréquentes pour obtenir des informations supplémentaires sur les pages et l'utilisation acceptable d'Amazon Textract.

Amazon Textract dispose de cinq API différentes : Detect Document Text API, Analyze Document API, Analyze Expense API, et Analyze ID API, et Analyze Lending API.

L'API Detect Document Text utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document.

L'API d'Analyze Document comporte quatre fonctionnalités : Formulaires, Tableaux, Requêtes et Signatures. Vous avez la possibilité d'appeler n'importe quelle combinaison de formulaires, de tableaux, de requêtes et de signatures ensemble.

  • L’API Analyze Document pour les Formulaires extrait des données telles que des paires clé-valeur (« Prénom » et valeur associée telle que « Jane Smith »). Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Tableaux extrait les données tabulaires organisées en colonnes et en lignes. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Requêtes vous donne la flexibilité de spécifier les informations dont vous avez besoin à partir d’un document (ex : « Quel est le nom du client ? ») et de recevoir ces données (ex : « Jane Doe ») dans le cadre de la réponse. Vous n’avez pas à vous soucier de la structure des données du document ou des différentes manières dont les données sont disposées dans différents formats et versions du document. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • Analyze Document API for Signatures permet de détecter les signatures manuscrites, les signatures électroniques et les paraphes sur tout document ou image. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
 
L'API Analyze Expense extrait les données des factures et des reçus, telles qu'un ID de facture, un n° de facture, facture # et la valeur associée de 12345. Amazon Textract reconnaît ces différents termes comme l'ID de facture et la valeur correspondante comme 12345, ce qui vous permet de disposer d'une taxonomie standard des champs courants. 
 
L'API Analyze ID utilise le machine learning pour comprendre le contexte des documents d'identité tels que des passeports, des permis de conduire et d'autres documents d'identification américains. Vous pouvez extraire automatiquement des données spécifiques telles que la date d'expiration et la date de naissance, ainsi qu'identifier et extraire intelligemment des informations implicites telles que le nom et l'adresse. Chaque image d'identification est considérée comme une page.
 
Analyze Lending API est une API spécialisée dans le traitement des documents hypothécaires qui automatise la classification et l'extraction d'informations à partir d'une série de documents de demande liés aux prêts hypothécaires. Les modèles de Machine learning d'Analyze Lending ont été pré-entraînés sur la diversité des types de documents que l'on retrouve dans un dossier de demande de prêt hypothécaire typique. Analyze Lending classera, divisera et extraira les résultats avec précision et fournira un résumé de vos résultats, indiquant notamment si une signature a été détectée ou non sur la page.
 

Demander un devis personnalisé

Pour les cas d'utilisation à grand volume, contactez notre équipe commerciale pour demander une proposition de tarif personnalisé.

Offre gratuite

Dans le cadre de l'offre gratuite d'AWS, vous pouvez démarrer avec Amazon Textract gratuitement. L’offre gratuite dure trois mois et les nouveaux clients AWS peuvent analyser jusqu’à :

API Detect Document Text : 1000 pages par mois
API Analyze Document :

  • 1 000 pages par mois en utilisant uniquement des signatures
  • 100 pages par mois pour l’utilisation de la fonction Formulaires ou Tableaux
  • 100 pages supplémentaires par mois pour l’utilisation de la fonction Requêtes NOUVEAU

API Analyze Expense : 100 pages par mois
API Analyze ID : 100 pages par mois

Analyze Lending API 2 000 pages par mois

Tarification des API Amazon Textract

*L'extrant de l'API Analyze Document est fourni avec l'OCR inclus, quel que soit le type de fonctionnalité sélectionné
*Les API Analyze Expense et Analyze ID incluent l'OCR dans l'extrant

Exemples de tarification hors offre gratuite

Exemple de tarification 1 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de 100 000 pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), la tarification par page est de 0,0015 USD pour le premier million de pages, soit un total de 150 USD.

Nombre total de pages traitées = 100 000

Tarif par page = 0,0015 USD

Coût total par mois = 0,0015 USD * 100 000 = 150 USD

Exemple de tarification 2 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de deux millions de pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD pour le premier million de pages et au-delà d'un million de pages, vous payez 0,0006 USD. Ainsi, pour le traitement de deux millions de pages, le coût total par mois serait de 2100 USD.

Nombre total de pages traitées = 2 000 000

Prix par page = 0,0015 USD pour le premier million et 0,0006 USD après le premier million de pages

Coût total par mois = 0,0015 USD * 1 000 000 + 0,0006 USD * 1 000 000 = 1500 USD + 600 USD = 2100 USD

Exemple de tarification 3 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données structurées provenant de 5 000 pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,05 USD avec formulaires, pour un total de 325 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau = 0,015 USD

Tarification par page avec formulaire (paire clé-valeur) = 0,05 USD

Coût total = 0,015 USD * 5000+ 0,05 USD * 5000 = 75 USD + 250 USD = 325 USD

Exemple de tarification 4 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,01 USD au-delà d'un million de pages. Le tarif pour les pages avec formulaires est de 0,05 USD pour un million de pages, et de 0,04 USD par page au delà. Le coût total s'élèverait à 115 000 USD.

Nombre total de pages traitées = 2 000 000

Prix de la page avec formulaire (paire clé-valeur) = 0,05 USD pour le premier million et 0,04 USD pour le million suivant

Coût total = 0,015 USD * 1 000 000 + 0,01 USD * 1 000 000 + 0,05 USD * 1 000 000 + 0,04 USD * 1 000 000 = 15 000 USD + 10 000 USD + 50 000 USD + 40 000 USD = 115 000 USD

Exemple de tarification 5 – API Analyze Document – Requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte provenant de 5000 pages issues de formulaires hypothécaires. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages, soit un total de 75 USD.

Nombre total de pages traitées = 5000

Prix par page avec Requêtes = 0,015 USD

Coût total = 0,015 USD * 5 000 = 75 USD

Exemple de tarification 6 - Analyze Document API - Formulaires, tableaux et requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de talons de chèques. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux, Formulaires et Requêtes est de 0,070 USD, et 0,055 USD au-delà d'un million de pages. Le coût total s'élèverait à 125 000 USD.

Nombre total de pages traitées = 2 000 000 

Prix par page avec Tableaux, Formulaires et Requêtes = 0,070 USD pour le premier million et 0,055 USD pour le million suivant 

Coût total = 0,070 USD * 1 000 000 + 0,055 USD * 1 000 000 = 70 000 USD + 55 000 USD = 125,000 USD

Exemple de tarification 7 - Analyze Document API - Formulaires et requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données de tableaux provenant de 5000 pages issues de formulaires fiscaux. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux et Requêtes est de 0,020 USD, et 0,015 USD au-delà d'un million de pages. Le coût total s'élèverait à 100 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau et Requêtes = 0,020 USD

Coût total = 0,020 USD * 5 000 = 100 USD

Exemple de tarification 8 - Analyze Document API - Signatures

Imaginons que vous souhaitiez détecter des signatures et extraire le texte brut de 100 000 pages de formulaires hypothécaires avec Analyze Document
API - type de caractéristique des signatures. Le prix par page dans la région USA Ouest (Oregon) pour le premier million de pages est de 0,0035 USD, soit un coût de
350 USD.
Nombre total de pages traitées = 100 000
Prix par page = 0,0035 USD
Coût total par mois = 0,00035 USD * 100 000 = 350 USD

Exemple de tarification 9 - Analyze Document API - Signatures

Imaginons que vous souhaitiez détecter des signatures et extraire le texte brut de 5 millions de pages de formulaires hypothécaires avec Analyze Document
- type de caractéristique des signatures. Le prix par page dans la région USA Ouest (Oregon) pour le premier million de pages est de 0,00035 USD, soit un coût de 20 USD.
Total des pages traitées = 5 000 000
Prix pour le premier million de pages = 0,0035 USD * 1 000 000 = 3 500 USD
Prix pour les prochaines 4 millions de pages = 0,0014 USD * 4 000 000 = 5 600 USD
Total = 3 500 USD + 5 600 USD = 9 100 USD

Exemple de tarification 10 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 100 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et vous avez 100 000 factures à traiter. Le coût total s'élève à 1 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 100 000 

Prix par page = 0,01 USD 

Coût total par mois = 0,01 USD * 100 000 = 1 000 USD

Exemple de tarification 11 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 1 500 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et de 0,008 USD au delà. Le coût total s'élèverait à 14 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 1 500 000 

Prix par page = 0,01 USD pour le premier million et 0,008 USD pour les 500 000 suivantes 

Coût total par mois = 0,01 USD * 1 000 000 + 0,008 USD * 500 000 = 14 000 USD

Exemple de tarification 12 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 100 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD jusqu'à 100 000 pages. Le coût total s'élèverait à 2 500 USD. 

Nombre total de pages traitées = 100 000 

Prix par page = 0,025 USD 

Coût total par mois = 0,025 USD * 100 000 = 2 500 USD

Exemple de tarification 13 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 600 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD pour 100 000 pages et de 0,01 USD par page au-delà. Le coût total s'élèverait à 7 500 USD.

Nombre total de pages traitées = 600 000

Prix par page = 0,025 USD pour les premières 100 000 et 0,01 USD pour les 500 000 suivantes

Coût total par mois = 0,025 USD * 100 000 + 0,01 USD * 500 000 = 7 500 USD

Exemple de tarification 14 – Analyze Lending API

Supposons que vous souhaitiez extraire des informations de 200 000 pages de documents de prêts hypothécaires à l'aide d’Analyze Lending API. Le prix par page dans la région USA Ouest (Oregon) est de 0,07 USD par page pour un maximum d'un million de pages. Sur les 200 000 pages que vous avez traitées, Analyze Lending a assuré la classification et l'extraction pour les types de documents qu'elle prend en charge, ce qui a donné lieu à 100 000 pages de classification et d'extraction de données. Le coût total serait de 7 000 USD pour les 100 000 pages.

Total des pages traitées = 200 000

Total des pages prises en charge par la classification et l'extraction = 100 000 

Prix par page = 0,07 USD

Coût total par mois = 0,07 USD * 100 000 = 7 000 USD

Exemple de tarification 15 – Analyze Lending API

Supposons que vous souhaitiez extraire des informations de 2 000 000 de pages de documents de prêts hypothécaires à l'aide d’Analyze Lending API. Le prix par page dans la région USA Ouest (Oregon) est de 0,07 USD par page jusqu'à un million de pages et de 0,055 USD par page au-delà de 1 000 000. Sur les 2 000 000 de pages que vous avez traitées, Analyze Lending a assuré la classification et l'extraction pour les types de documents qu'elle prend en charge, ce qui a donné lieu à 1 200 000 pages de classification et d'extraction de données. Le coût total serait de 81 000 USD pour les 1 200 000 pages.

Nombre total de pages traitées = 2 000 000

Nombre total de pages prises en charge par la classification et l'extraction = 1 200 000

Prix par page = 0,07 USD pour les premiers 1M et 0,055 USD pour les 200 000 suivants

Coût total par mois = 0,07 USD * 1 000 000 + 0,055 USD * 200 000 = 81 000 USD

Consulter les questions fréquentes sur Amazon Textract

Découvrez comment Amazon Textract permet d'extraire du texte et des données structurées à partir de la quasi-totalité des documents.

En savoir plus 
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire