Amazon Textract est un service de machine learning (ML) qui extrait automatiquement le texte, l'écriture manuscrite et les données des documents numérisés. Il va au-delà de la simple reconnaissance optique de caractères (OCR) pour identifier, comprendre et extraire les données des formulaires et des tableaux. Avec Amazon Textract, vous ne payez que ce que vous utilisez. Il n'y a pas de frais minimums et aucun engagement initial n'est requis. Amazon Textract est facturé uniquement pour les pages traitées, que vous extrayiez du texte seul, du texte avec des tableaux, des données de formulaire, des requêtes ou que vous traitiez des factures et des documents d’identité. Consultez les questions fréquentes pour obtenir des informations supplémentaires sur les pages et l'utilisation acceptable d'Amazon Textract.

Amazon Textract dispose de quatre API différents : l'API Detect Document Text, l'API Analyze Document, l'API Analyze Expense et l'API Analyze ID.

L'API Detect Document Text utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document.

L’API Analyze Document a trois fonctionnalités : Formulaires, Tableaux et Requêtes. Vous avez la possibilité flexible d’appeler ensemble n’importe quelle combinaison de Formulaires, de Tableaux et de Requêtes.

  • L’API Analyze Document pour les Formulaires extrait des données telles que des paires clé-valeur ("Prénom" et valeur associée telle que "Jane Smith"). Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Tableaux extrait les données tabulaires organisées en colonnes et en lignes. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Requêtes vous donne la flexibilité de spécifier les informations dont vous avez besoin à partir d’un document (ex : « Quel est le nom du client ? ») et de recevoir ces données (ex : « Jane Doe ») dans le cadre de la réponse. Vous n’avez pas à vous soucier de la structure des données du document ou des différentes manières dont les données sont disposées dans différents formats et versions du document. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
 
L'API Analyze Expense extrait les données des factures et des reçus, telles qu'un ID de facture, un n° de facture, facture # et la valeur associée de 12345. Amazon Textract reconnaît ces différents termes comme l'ID de facture et la valeur correspondante comme 12345, ce qui vous permet de disposer d'une taxonomie standard des champs courants. 
 
L'API Analyze ID utilise le machine learning pour comprendre le contexte des documents d'identité tels que des passeports, des permis de conduire et d'autres documents d'identification américains. Vous pouvez extraire automatiquement des données spécifiques telles que la date d'expiration et la date de naissance, ainsi qu'identifier et extraire intelligemment des informations implicites telles que le nom et l'adresse. Chaque image d'identification est considérée comme une page.
 

Demander un devis personnalisé

Pour les cas d'utilisation à grand volume, contactez notre équipe commerciale pour demander une proposition de tarif personnalisé.

Offre gratuite

Dans le cadre de l'offre gratuite d'AWS, vous pouvez démarrer avec Amazon Textract gratuitement. L’offre gratuite dure trois mois et les nouveaux clients AWS peuvent analyser jusqu’à :

API Detect Document Text : 1000 pages par mois
API Analyze Document :

  • 100 pages par mois pour l’utilisation de la fonction Formulaires ou Tableaux
  • 100 pages supplémentaires par mois pour l’utilisation de la fonction Requêtes NOUVEAU

API Analyze Expense : 100 pages par mois
API Analyze ID : 100 pages par mois

Tarification des API Amazon Textract

*L’extrant de l’API Analyze Document est fourni avec l’OCR inclus, quel que soit le type de fonctionnalité sélectionné
*Les API Analyze Expense et Analyze ID n’incluent pas l’OCR dans l’extrant

Exemples de tarification hors offre gratuite

Exemple de tarification 1 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de 100 000 pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), la tarification par page est de 0,0015 USD pour le premier million de pages, soit un total de 150 USD.

Nombre total de pages traitées = 100 000

Tarif par page = 0,0015 USD

Coût total par mois = 0,0015 USD * 100 000 = 150 USD

Exemple de tarification 2 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de deux millions de pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD pour le premier million de pages et au-delà d'un million de pages, vous payez 0,0006 USD. Ainsi, pour le traitement de deux millions de pages, le coût total par mois serait de 2100 USD.

Nombre total de pages traitées = 2 000 000

Prix par page = 0,0015 USD pour le premier million et 0,0006 USD après le premier million de pages

Coût total par mois = 0,0015 USD * 1 000 000 + 0,0006 USD * 1 000 000 = 1500 USD + 600 USD = 2100 USD

Exemple de tarification 3 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données structurées provenant de 5 000 pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,05 USD avec formulaires, pour un total de 325 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau = 0,015 USD

Tarification par page avec formulaire (paire clé-valeur) = 0,05 USD

Coût total = 0,015 USD * 5000+ 0,05 USD * 5000 = 75 USD + 250 USD = 325 USD

Exemple de tarification 4 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,01 USD au-delà d'un million de pages. Le tarif pour les pages avec formulaires est de 0,05 USD pour un million de pages, et de 0,04 USD par page au delà. Le coût total s'élèverait à 115 000 USD.

Nombre total de pages traitées = 2 000 000

Prix de la page avec formulaire (paire clé-valeur) = 0,05 USD pour le premier million et 0,04 USD pour le million suivant

Coût total = 0,015 USD * 1 000 000 + 0,01 USD * 1 000 000 + 0,05 USD * 1 000 000 + 0,04 USD * 1 000 000 = 15 000 USD + 10 000 USD + 50 000 USD + 40 000 USD = 115 000 USD

Exemple de tarification 5 – API Analyze Document – Requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte provenant de 5000 pages issues de formulaires hypothécaires. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages, soit un total de 75 USD.

Nombre total de pages traitées = 5000

Prix par page avec Requêtes = 0,015 USD

Coût total = 0,015 USD * 5000 = 75 USD

Exemple de tarification 6 – API Analyze Document – Formulaires et Requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données de tableaux provenant de 5000 pages issues de formulaires fiscaux. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux et Requêtes est de 0,020 USD, et 0,015 USD au-delà d'un million de pages. Le coût total s'élèverait à 100 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau et Requêtes = 0,020 USD

Coût total = 0,020 USD * 5000 = 100 USD

Exemple de tarification 7 – API Analyze Document – Formulaires et Requêtes

Imaginons que vous souhaitiez extraire les données de texte et de formulaires (paires clé-valeur) de 5000 pages de formulaires d’assurance à l’aide de l’API Analyze Document. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Formulaires et Requêtes est de 0,055 USD, et 0,045 USD au-delà d'un million de pages. Le coût total s'élèverait à 275 USD.

Nombre total de pages traitées = 5 000

Tarification par page avec Formulaires (paire clé-valeur) et Requêtes = 0,055 USD

Coût total = 0,055 USD * 5000 = 275 USD

Exemple de tarification 8 – API Analyze Document – Formulaires et Tableaux et Requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de talons de chèques. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux, Formulaires et Requêtes est de 0,070 USD, et 0,055 USD au-delà d'un million de pages. Le coût total s'élèverait à 125 000 USD.

Nombre total de pages traitées = 2 000 000 

Prix par page avec Tableaux, Formulaires et Requêtes = 0,070 USD pour le premier million et 0,055 USD pour le million suivant 

Coût total = 0,070 USD * 1 000 000 + 0,055 USD * 1 000 000 = 70 000 USD + 55 000 USD = 125,000 USD

Exemple de tarification 9 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 100 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et vous avez 100 000 factures à traiter. Le coût total s'élève à 1 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 100 000 

Prix par page = 0,01 USD 

Coût total par mois = 0,01 USD * 100 000 = 1000 USD

Exemple de tarification 10 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 1 500 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et de 0,008 USD au delà. Le coût total s'élèverait à 14 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 1 500 000 

Prix par page = 0,01 USD pour le premier million et 0,008 USD pour les 500 000 suivantes 

Coût total par mois = 0,01 USD * 1 000 000 + 0,008 USD * 500 000 = 14 000 USD

Exemple de tarification 11 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 100 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD jusqu'à 100 000 pages. Le coût total s'élèverait à 2 500 USD. 

Nombre total de pages traitées = 100 000 

Prix par page = 0,025 USD 

Coût total par mois = 0,025 USD * 100 000 = 2 500 USD

Exemple de tarification 12 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 600 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD pour 100 000 pages et de 0,01 USD par page au-delà. Le coût total s'élèverait à 7500 USD.

Nombre total de pages traitées = 600 000 

Prix par page = 0,025 USD pour les 100 000 premières et 0,01 USD pour les 500 000 suivantes 

Coût total par mois = 0,025 USD * 100 000 + 0,01 USD * 500 000 = 7500 USD

Consulter les questions fréquentes sur Amazon Textract

Découvrez comment Amazon Textract permet d'extraire du texte et des données structurées à partir de la quasi-totalité des documents.

En savoir plus 
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire