Amazon Textract est un service de machine learning (ML) qui extrait automatiquement le texte, l'écriture manuscrite et les données des documents numérisés. Il va au-delà de la simple reconnaissance optique de caractères (OCR) pour identifier, comprendre et extraire les données des formulaires et des tableaux. Avec Amazon Textract, vous ne payez que ce que vous utilisez. Il n'y a pas de frais minimums et aucun engagement initial n'est requis. Amazon Textract est facturé uniquement pour les pages traitées, que vous extrayiez du texte seul, du texte avec des tableaux, des données de formulaire, des requêtes ou que vous traitiez des factures et des documents d’identité. Consultez les questions fréquentes pour obtenir des informations supplémentaires sur les pages et l'utilisation acceptable d'Amazon Textract.

Amazon Textract dispose de cinq API différentes : Detect Document Text API, Analyze Document API, Analyze Expense API, et Analyze ID API, et Analyze Lending API.

L'API Detect Document Text utilise la technologie d'OCR pour extraire le texte et l'écriture manuscrite d'un document.

L'API d'Analyze Document comporte quatre fonctionnalités : Formulaires, Tableaux, Requêtes et Signatures. Vous avez la possibilité d'appeler n'importe quelle combinaison de formulaires, de tableaux, de requêtes et de signatures ensemble.

  • L’API Analyze Document pour les Formulaires extrait des données telles que des paires clé-valeur (« Prénom » et valeur associée telle que « Jane Smith »). Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Tableaux extrait les données tabulaires organisées en colonnes et en lignes. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L’API Analyze Document pour les Requêtes vous donne la flexibilité de spécifier les informations dont vous avez besoin à partir d’un document (ex : « Quel est le nom du client ? ») et de recevoir ces données (ex : « Jane Doe ») dans le cadre de la réponse. Vous n’avez pas à vous soucier de la structure des données du document ou des différentes manières dont les données sont disposées dans différents formats et versions du document. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.
  • L'API Analyze Document pour les requêtes personnalisées vous permet d'appeler la fonctionnalité de requêtes personnalisées pour les documents spécifiques à votre entreprise. Vous entraînez un adaptateur à l'aide de la console AWS et vous utilisez l'identifiant de l'adaptateur dans votre demande d'API Analyze Document pour utiliser des requêtes personnalisées.
  • Analyze Document API for Signatures permet de détecter les signatures manuscrites, les signatures électroniques et les paraphes sur tout document ou image. Il utilise par ailleurs la technologie OCR pour extraire le texte et l'écriture manuscrite d'un document.

 

L'API Analyze ID utilise le machine learning pour comprendre le contexte des documents d'identité tels que des passeports, des permis de conduire et d'autres documents d'identification américains. Vous pouvez extraire automatiquement des données spécifiques telles que la date d'expiration et la date de naissance, ainsi qu'identifier et extraire intelligemment des informations implicites telles que le nom et l'adresse. Chaque image d'identification est considérée comme une page.
 
L'API Analyze Lending est une API spécialisée de traitement des documents hypothécaires qui automatise la classification et l'extraction d'informations à partir d'une gamme de documents de demande liés aux prêts hypothécaires. Les modèles de Machine learning d'Analyze Lending ont été pré-entraînés sur la diversité des types de documents que l'on retrouve dans un dossier de demande de prêt hypothécaire typique. Analyze Lending classera, divisera et extraira les résultats avec précision et fournira un résumé de vos résultats, indiquant notamment si une signature a été détectée ou non sur la page.
 

Demander un devis personnalisé

Pour les cas d'utilisation à grand volume, contactez notre équipe commerciale pour demander une proposition de tarif personnalisé.

Offre gratuite

Dans le cadre de l'offre gratuite d'AWS, vous pouvez démarrer avec Amazon Textract gratuitement. L’offre gratuite dure trois mois et les nouveaux clients AWS peuvent analyser jusqu’à :

API Detect Document Text : 1000 pages par mois
API Analyze Document :

  • 1 000 pages par mois en utilisant uniquement des signatures
  • 100 pages par mois lors de l'utilisation des formulaires, des tableaux et des fonctionnalités de mise en page
  • 100 pages par mois chacune pour les requêtes, les formulaires + requêtes, les tables + requêtes, les formulaires + tables et les requêtes
  • Il n'existe pas de niveau gratuit pour les requêtes personnalisées

API Analyze Expense : 100 pages par mois

API Analyze ID : 100 pages par mois

Analyze Lending API 2 000 pages par mois

Tarification des API Amazon Textract

Fonctionnalités préformées

*L'extrant de l'API Analyze Document est fourni avec l'OCR inclus, quel que soit le type de fonctionnalité sélectionné
*Les API Analyze Expense et Analyze ID incluent l'OCR dans l'extrant

Fonctionnalités préformées et personnalisées

Exemples de tarification hors offre gratuite

Exemple de tarification 1 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de 100 000 pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), la tarification par page est de 0,0015 USD pour le premier million de pages, soit un total de 150 USD.

Nombre total de pages traitées = 100 000

Tarif par page = 0,0015 USD

Coût total par mois = 0,0015 USD * 100 000 = 150 USD

Exemple de tarification 2 – API Detect Document Text

Imaginons que vous souhaitiez, à l'aide de l'API Detect Document Text, extraire le texte provenant de deux millions de pages issues de rapports de recherche. Dans la région USA Ouest (Oregon), vous payez 0,0015 USD pour le premier million de pages et au-delà d'un million de pages, vous payez 0,0006 USD. Ainsi, pour le traitement de deux millions de pages, le coût total par mois serait de 2100 USD.

Nombre total de pages traitées = 2 000 000

Prix par page = 0,0015 USD pour le premier million et 0,0006 USD après le premier million de pages

Coût total par mois = 0,0015 USD * 1 000 000 + 0,0006 USD * 1 000 000 = 1500 USD + 600 USD = 2100 USD

Exemple de tarification 3 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données structurées provenant de 5 000 pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,05 USD avec formulaires, pour un total de 325 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau = 0,015 USD

Tarification par page avec formulaire (paire clé-valeur) = 0,05 USD

Coût total = 0,015 USD * 5000+ 0,05 USD * 5000 = 75 USD + 250 USD = 325 USD

Exemple de tarification 4 – API Analyze Document – Formulaires et tableaux

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de formulaires fiscaux. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages avec tableaux et 0,01 USD au-delà d'un million de pages. Le tarif pour les pages avec formulaires est de 0,05 USD pour un million de pages, et de 0,04 USD par page au delà. Le coût total s'élèverait à 115 000 USD.

Nombre total de pages traitées = 2 000 000

Prix de la page avec formulaire (paire clé-valeur) = 0,05 USD pour le premier million et 0,04 USD pour le million suivant

Coût total = 0,015 USD * 1 000 000 + 0,01 USD * 1 000 000 + 0,05 USD * 1 000 000 + 0,04 USD * 1 000 000 = 15 000 USD + 10 000 USD + 50 000 USD + 40 000 USD = 115 000 USD

Exemple de tarification 5 – API Analyze Document – Requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte provenant de 5000 pages issues de formulaires hypothécaires. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page est de 0,015 USD pour un million de pages, soit un total de 75 USD.

Nombre total de pages traitées = 5000

Prix par page avec Requêtes = 0,015 USD

Coût total = 0,015 USD * 5 000 = 75 USD

Exemple de tarification 6 - Analyze Document API - Formulaires, tableaux et requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte, les formulaires et les tableaux provenant de deux millions de pages issues de talons de chèques. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux, Formulaires et Requêtes est de 0,070 USD, et 0,055 USD au-delà d'un million de pages. Le coût total s'élèverait à 125 000 USD.

Nombre total de pages traitées = 2 000 000 

Prix par page avec Tableaux, Formulaires et Requêtes = 0,070 USD pour le premier million et 0,055 USD pour le million suivant 

Coût total = 0,070 USD * 1 000 000 + 0,055 USD * 1 000 000 = 70 000 USD + 55 000 USD = 125,000 USD

Exemple de tarification 7 - Analyze Document API - Formulaires et requêtes

Imaginons que vous souhaitiez, à l'aide de l'API Analyze Document, extraire le texte et les données de tableaux provenant de 5000 pages issues de formulaires fiscaux. Vous souhaitez par ailleurs extraire 10 points de données spécifiques de chaque page via Requêtes. Dans la région USA Ouest (Oregon), la tarification par page pour un million de pages avec Tableaux et Requêtes est de 0,020 USD, et 0,015 USD au-delà d'un million de pages. Le coût total s'élèverait à 100 USD.

Nombre total de pages traitées = 5000

Prix par page avec tableau et Requêtes = 0,020 USD

Coût total = 0,020 USD * 5 000 = 100 USD

Exemple de tarification 8 - Analyze Document API - Signatures

Imaginons que vous souhaitiez détecter des signatures et extraire le texte brut de 100 000 pages de formulaires hypothécaires avec Analyze Document
API - type de caractéristique des signatures. Le prix par page dans la région USA Ouest (Oregon) pour le premier million de pages est de 0,0035 USD, soit un coût de
350 USD.
Nombre total de pages traitées = 100 000
Prix par page = 0,0035 USD
Coût total par mois = 0,00035 USD * 100 000 = 350 USD

Exemple de tarification 9 - Analyze Document API - Signatures

Imaginons que vous souhaitiez détecter des signatures et extraire le texte brut de 5 millions de pages de formulaires hypothécaires avec Analyze Document
- type de caractéristique des signatures. Le prix par page dans la région USA Ouest (Oregon) pour le premier million de pages est de 0,00035 USD, soit un coût de 20 USD.
Total des pages traitées = 5 000 000
Prix pour le premier million de pages = 0,0035 USD * 1 000 000 = 3 500 USD
Prix pour les prochaines 4 millions de pages = 0,0014 USD * 4 000 000 = 5 600 USD
Total = 3 500 USD + 5 600 USD = 9 100 USD

Exemple de tarification 10 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 100 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et vous avez 100 000 factures à traiter. Le coût total s'élève à 1 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 100 000 

Prix par page = 0,01 USD 

Coût total par mois = 0,01 USD * 100 000 = 1 000 USD

Exemple de tarification 11 – API Analyze Expense

Imaginons que vous souhaitiez extraire des données de 1 500 000 factures à l'aide de l'API Analyze Expense. Dans la région USA Ouest (Oregon), la tarification par page est de 0,01 USD pour un million de pages et de 0,008 USD au delà. Le coût total s'élèverait à 14 000 USD. Voir le calcul ci-après : 

Nombre total de pages traitées = 1 500 000 

Prix par page = 0,01 USD pour le premier million et 0,008 USD pour les 500 000 suivantes 

Coût total par mois = 0,01 USD * 1 000 000 + 0,008 USD * 500 000 = 14 000 USD

Exemple de tarification 12 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 100 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD jusqu'à 100 000 pages. Le coût total s'élèverait à 2 500 USD. 

Nombre total de pages traitées = 100 000 

Prix par page = 0,025 USD 

Coût total par mois = 0,025 USD * 100 000 = 2 500 USD

Exemple de tarification 13 – API Analyze ID

Disons que vous souhaitiez extraire des informations de 600 000 documents d'identité à l'aide de l'API Analyze ID. Dans la région USA Ouest (Oregon), la tarification par page est de 0,025 USD pour 100 000 pages et de 0,01 USD par page au-delà. Le coût total s'élèverait à 7 500 USD.

Nombre total de pages traitées = 600 000

Prix par page = 0,025 USD pour les premières 100 000 et 0,01 USD pour les 500 000 suivantes

Coût total par mois = 0,025 USD * 100 000 + 0,01 USD * 500 000 = 7 500 USD

Exemple de tarification 14 – Analyze Lending API

Supposons que vous souhaitiez extraire des informations de 200 000 pages de documents de prêts hypothécaires à l'aide d’Analyze Lending API. Le prix par page dans la région USA Ouest (Oregon) est de 0,07 USD par page pour un maximum d'un million de pages. Sur les 200 000 pages que vous avez traitées, Analyze Lending a assuré la classification et l'extraction pour les types de documents qu'elle prend en charge, ce qui a donné lieu à 100 000 pages de classification et d'extraction de données. Le coût total serait de 7 000 USD pour les 100 000 pages.

Total des pages traitées = 200 000

Total des pages prises en charge par la classification et l'extraction = 100 000 

Prix par page = 0,07 USD

Coût total par mois = 0,07 USD * 100 000 = 7 000 USD

Exemple de tarification 15 – Analyze Lending API

Supposons que vous souhaitiez extraire des informations de 2 000 000 de pages de documents de prêts hypothécaires à l'aide d’Analyze Lending API. Le prix par page dans la région USA Ouest (Oregon) est de 0,07 USD par page jusqu'à un million de pages et de 0,055 USD par page au-delà de 1 000 000. Sur les 2 000 000 de pages que vous avez traitées, Analyze Lending a assuré la classification et l'extraction pour les types de documents qu'elle prend en charge, ce qui a donné lieu à 1 200 000 pages de classification et d'extraction de données. Le coût total serait de 81 000 USD pour les 1 200 000 pages.

Nombre total de pages traitées = 2 000 000

Nombre total de pages prises en charge par la classification et l'extraction = 1 200 000

Prix par page = 0,07 USD pour les premiers 1M et 0,055 USD pour les 200 000 suivants

Coût total par mois = 0,07 USD * 1 000 000 + 0,055 USD * 200 000 = 81 000 USD

Exemple de tarification 16 — API d'analyse de documents — Mise en page et tableaux

Vous devez extraire la mise en page et les tableaux de deux millions de pages de rapports financiers à l'aide de l'API Analyze Document. La mise en page est disponible gratuitement lorsqu'elle est utilisée avec la fonctionnalité Tables. Le prix des tableaux dans la région de l'ouest des États-Unis (Oregon) est de 0,015 USD par page pour le premier million de pages par mois et de 0,010 USD par page pour les pages dépassant 1 million de pages par mois.

Nombre total de pages traitées = 2 000 000

Prix pour les 1M premières pages = 0,015 $* 1 000 000 = 15 000$

Prix pour les 1M de pages suivantes = 0,010 $* 1 000 000 = 10 000$

Frais totaux = 25 000$

Exemple de tarification 17 - API d'analyse de documents — Requêtes personnalisées

Vous devez extraire les données de 5 millions de pages à l'aide de requêtes personnalisées. Le prix dans la région de l'ouest des États-Unis (Oregon) est de 0,025 $ par page pour le premier million de pages par mois et de 0,015 $ par page pour les pages dépassant 1 million de pages par mois.

Nombre total de pages traitées = 5 000 000

Prix pour les 1M de premières pages = 0,025 $ * 1 000 000 $ = 25 000 $

Prix pour les 4 millions de pages suivantes = 0,015 $ * 4 000 000 $ = 60 000 $

Frais totaux = 85 000$

Exemple de tarification 18 - API d'analyse de documents — Formulaires préformés et requêtes personnalisées

Vous devez extraire des points de données à partir de 2 millions de pages à l'aide de formulaires préformés et de requêtes personnalisées. Le prix dans la région de l'ouest des États-Unis (Oregon) est de 0,065 $ par page pour le premier million de pages par mois et de 0,050 $ par page pour les pages dépassant 1 million de pages par mois.

Nombre total de pages traitées = 2 000 000

Prix pour les 1M premières pages = 0,065 $* 1 000 000 = 65 000$

Prix pour les 1M de pages suivantes = 0,050 $* 1 000 000 = 50 000$

Frais totaux = 115 000$

Consulter les questions fréquentes sur Amazon Textract

Découvrez comment Amazon Textract permet d'extraire du texte et des données structurées à partir de la quasi-totalité des documents.

En savoir plus 
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer avec AWS

Commencez à créer avec Amazon Textract dans AWS Management Console.

S'inscrire