Amazon Textract est un service de machine learning (ML) qui utilise la technologie de reconnaissance optique de caractères (OCR) pour extraire automatiquement le texte, l'écriture manuscrite et les données de documents scannés comme des PDF. Avec Amazon Textract, vous ne payez que ce que vous utilisez. Il n'y a pas de frais minimums et aucuns engagements initiaux. Amazon Textract est facturé uniquement pour les pages traitées, que ce soit pour une extraction de texte, de texte avec tableaux et/ou de données de formulaires. Consultez les questions fréquentes pour obtenir des informations supplémentaires sur les pages et l'utilisation acceptable de Textract.

Amazon Textract dispose de trois API différentes : l'API Detect Document Text, l'API Analyze Document et l'API Analyze Expense.

L'API Detect Document Text utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document fourni. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD par page pour le premier million de pages et 0,0006 USD par page au-delà d'un million de pages.

L'API Analyze Document dispose de deux fonctions, les formulaires et les tableaux, avec différents niveaux de prix.

  • L'API Analyze Document pour les formulaires utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document fourni. Elle extrait également des données telles que des paires clé-valeur (« Prénom » et la valeur associée : « Jane Smith »). Dans la région USA Ouest (Oregon), vous payez 0,05 USD par page pour le premier million de pages et 0,04 USD par page au-delà d'un million de pages.
  • L'API Analyze Document pour les tableaux utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document fourni. Elle extrait également les données des tableaux organisées en colonnes et en lignes. Dans la région USA Ouest (Oregon), vous payez 0,015 USD par page pour le premier million de pages et 0,01 USD par page au-delà d'un million de pages.
 
L' API Analyze Expense extrait les données des factures et des reçus. Par exemple, une facture ou un reçu peut contenir des données dans de telles « ID de facture », « N° de facture », « Numéro de facture », ainsi que la valeur associée de 12345. Amazon Textract reconnaît ces différents termes comme l'ID de facture et la valeur correspondante comme 12345, ce qui vous permet de disposer d'une taxonomie standard des champs courants. Dans la région USA Ouest (Oregon), vous payez 0,01 USD par page pour le premier million de pages et 0,008 USD par page au-delà d'un million de pages.

Offre gratuite

Dans le cadre de l'offre gratuite d'AWS, vous pouvez démarrer avec Amazon Textract gratuitement. L'offre gratuite dure trois mois et les nouveaux clients AWS peuvent analyser jusqu'à 1000 pages par mois en utilisant l'API Detect Document Text et jusqu'à 100 pages par mois en utilisant l'API Analyze Document ou l'API Analyze Expense.

Tarification des API Amazon Textract

API Detect Document Text (avec technologie OCR)


API Analyze Document (pages avec tables)

* Les tables constituent des ensembles de données associées qui sont visuellement organisées sous formes de colonnes et de lignes (comme dans le cas d'un fichier permettant d'effectuer un suivi de la production quotidienne d'une usine, par exemple).


API Analyze Document (pages avec formulaires)

* Les formulaires constituent des ensembles de clés et valeurs indépendantes se trouvant sur la même page (comme dans le cas d'un formulaire de déclaration d'impôts, par exemple).


API Analyze Document (pages avec tables et formulaires)


API d'analyse des dépenses pour les factures et les reçus

Exemples de tarification (hors offre gratuite)

Exemple de tarification 1 – API de détection de texte de documents

Supposons que vous souhaitez, à l'aide de l'API Detect Document Text, extraire le texte provenant de 100 000 pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD pour le premier million de pages. Ainsi, pour le traitement de 100 000 pages, le coût total par mois serait de 150 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 100 000

Tarif par page = 0,0015 USD

Coût total par mois = 0,0015 USD*100 000 = 150 USD

Exemple de tarification 2 – API Detect Document Text

Supposons que vous souhaitez, à l'aide de l'API Detect Document Text, extraire le texte provenant de deux millions de pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD pour le premier million de pages et au delà d'un million de pages, vous payez 0,0006 USD. Ainsi, pour le traitement de deux millions pages, le coût total par mois serait de 2 100 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 2 000 000

Prix par page = 0,0015 USD pour le premier million et 0,0006 USD après le premier million de pages

Coût total par mois = 0,0015 USD * 1 000 000 + 0,0006 USD * 1 000 000 = 1 500 USD + 600 USD = 2 100 USD

Exemple de tarification 3 – API Analyze Document – Formulaires et tableaux

Supposons que vous souhaitez, à l'aide de l'API Analyze Document, extraire le texte et les données structurées provenant de 5 000 pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,05 USD avec formulaires, pour un total de 325 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 5 000

Prix par page avec tableau = 0,015 USD

Tarification par page avec formulaire (paire clé-valeur) = 0,05 USD

Coût total = 0,015 USD * 5 000+ 0,05 USD * 5 000 = 75 USD + 250 USD = 325 USD

Exemple de tarification 4 – API Analyze Document – Formulaires et tableaux

Supposons que vous souhaitez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,01 USD au delà d'un million de pages. Le tarif pour les pages avec formulaires est de 0,05 USD pour un million de pages, et de 0,04 USD par page au delà. Le coût total s'élèverait à 115 000 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 2 000 000

Prix de la page avec tableau = 0,015 USD pour le premier million et 0,01 USD pour le million suivant

Prix de la page avec formulaire (paire clé-valeur) = 0,05 USD pour le premier million et 0,04 USD pour le million suivant

Coût total = 0,015 USD*1 000 000 + 0,01 USD*1 000 000 + 0,05 USD*1 000 000 + 0,04 USD*1 000 000 = 15 000 USD + 10 000 USD + 50 000 USD + 40 000 USD = 115 000 USD

Exemple de tarification 5 – API Analyze Expense

Supposons que vous souhaitiez extraire des données de 100 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et vous avez 100 000 factures à traiter. Le coût total s'élève à 1 000 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 100 000

Prix par page = 0,01 USD

Coût total par mois = 0,01 USD*100 000 = 1 000 USD

Exemple de tarification 6 – API Analyze Expense

Supposons que vous souhaitiez extraire des données de 1 500 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et de 0,008 USD au delà. Le coût total s'élèverait à 14 000 USD. Voir le calcul ci-après :

Nombre total de pages traitées = 1 500 000

Prix par page = 0,01 USD pour le premier million et 0,008 USD pour les 500 000 suivantes

Coût total par mois = 0,01 USD * 1 000 000 + 0,008 USD * 500 000 = 14 000 USD

Standard Product Icons (Features) Squid Ink
Consulter les questions fréquentes sur Amazon Textract

Découvrez comment Amazon Textract permet d'extraire du texte et des données structurées à partir de la quasi-totalité des documents.

En savoir plus 
Sign up for a free account
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Standard Product Icons (Start Building) Squid Ink
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire