Amazon Textract は、スキャンしたドキュメントからテキスト、手書き文字、およびデータを自動的に抽出する機械学習 (ML) サービスです。これは、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやラベルからデータを識別、理解、および抽出します。Amazon Textract では、使用した分のみ料金が発生します。最低料金や前払いの義務はありません。Amazon Textract は、テキスト、表付きテキスト、フォームデータ、クエリの抽出、請求書や身分証明書の処理など、いずれの場合でも、処理されたページに対してのみ課金されます。 ページおよび Amazon Textract の利用規約の詳細についてはよくある質問をご覧ください。

Amazon Textract には、Detect Document Text API、Analyze Document API、Analyze Expense API、Analyze ID API、および Analyze Lending API の 5 つの異なる API があります。

Detect Document Text API は、OCR テクノロジーを使用して、ドキュメントからテキストと手書き文字を抽出します。

Analyze Document API は、フォーム、テーブル、クエリ、署名の 4 つの機能を備えています。フォーム、テーブル、クエリ、および署名の任意の組み合わせを柔軟に呼び出すことができます。

  • Analyze Document API for Forms は、キーと値のペア (「First Name」と関連付けられている値、例えば「Jane Smith」) のようなデータを抽出します。また、OCR テクノロジーを使用して、ドキュメントからすべてのテキストと手書き文字を抽出します。
  • Analyze Document API for Tables は、列や行で構成された表形式、または表のデータを抽出します。また、OCR テクノロジーを使用して、ドキュメントからすべてのテキストと手書き文字を抽出します。
  • Analyze Document API for Queries は、ドキュメントから必要な情報を指定し (例えば、「顧客名は何か?」)、そのデータ (例えば、「Jane Doe」) を応答の一部として受信する柔軟性をお客様に提供します。ドキュメント内のデータの構造や、ドキュメントの異なるフォーマットやバージョン間でのデータのレイアウトのバリエーションを気にする必要はありません。また、OCR テクノロジーを使用して、ドキュメントからすべてのテキストと手書き文字を抽出します。
  • Analyze Document API for Custom Queries は、ビジネス固有のドキュメント用にカスタマイズされたクエリ機能を呼び出す機能を提供します。AWS コンソールを使用してアダプターをトレーニングし、Analyze Document API リクエストのアダプター識別子でカスタムクエリを使用します。
  • Analyze Document API for Signatures は、任意のドキュメントまたは画像の手書き署名、電子署名、イニシャルを検出する機能を提供します。また、OCR テクノロジーを使用して、ドキュメントからすべてのテキストと手書き文字を抽出します。

 

Analyze ID API は、機械学習を使用して、米国のパスポート、運転免許証、その他の ID などの身分証明書を理解します。有効期限や生年月日などの特定の情報を自動的に抽出できるだけでなく、名前や住所などの黙示的な情報をインテリジェントに識別して抽出することもできます。各 ID 画像は 1 ページとみなされます。
 
Analyze Lending API は、さまざまな住宅ローン関連のアプリケーション ドキュメントからの情報の分類と抽出を自動化する、住宅ローンドキュメント処理のための特殊な API です。Analyze Lending の機械学習モデルは、住宅ローンの典型的な一連の申請書類に含まれるさまざまな種類のドキュメントで事前にトレーニングされています。Analyze Lending は、結果を正確に分類、分割、抽出し、ページで署名が検出されたかどうかなど、結果の概要を提供します。
 

カスタム見積もりを依頼

大量に使用する場合は、当社の営業担当者に連絡して、カスタム価格提案書を請求してください。

無料利用枠

Amazon Textract は AWS 無料利用枠に含まれており、無料で使用開始できます。無料利用枠は 3 か月間有効で、新規に AWS をご利用になるお客様は、最大で次の分析が可能です。

Detect Document Text API: 1,000 ページ/月
Analyze Document API:

  • 1,000 ページ/月 (署名のみを使用する場合)
  • フォーム、テーブル、およびレイアウトの機能を使用する場合、100 ページ/月
  • クエリ、フォーム + クエリ、テーブル + クエリ、フォーム + テーブル + クエリ、それぞれ 100 ページ/月
  • カスタムクエリには無料利用枠はありません

Analyze Expense API: 100 ページ/月

Analyze ID API: 100 ページ/月

Analyze Lending API: 2,000 ページ/月

Amazon Textract API の料金

事前トレーニング済みの機能

*Analyze Document API の出力には、選択した機能タイプに関係なく OCR が含まれます。
*Analyze Expense API と Analyze ID API の出力に OCR は含まれています。

事前トレーニング済み + カスタマイズされた機能

無料利用枠を超えた料金の例

料金例 1 - Detect Document Text API

Detect Document Text API を使用して 100,000 ページの研究レポートからテキストを抽出するとします。米国西部 (オレゴン) リージョンでは、最初の 100 万ページの 1 ページあたりの料金は 0.0015 USD で、コストは 150 USD です。

処理する総ページ = 100,000

ページあたりの料金 = 0.0015 USD

月あたりの合計料金 = 0.0015 USD × 100,000 = 150 USD

料金例 2 - Detect Document Text API

Detect Document Text API を使用して 200 万ページの研究レポートからテキストを抽出するとしましょう。米国西部 (オレゴン) リージョンでの 1 ページあたりの料金は、最初の 100 万ページまでは 0.0015 USD、100 万ページ以降は 0.0006 USD となっており、200 万ページを処理する場合の総コストは 2,100 USD となります。

処理する総ページ = 2,000,000

ページあたりの料金 = 最初の 100 万ページまでは 0.0015 USD、100 万ページを超える分は 0.0006 USD

月あたりの合計料金 = 0.0015 USD × 1,000,000 + 0.0006 USD × 1,000,000 = 1,500 USD + 600 USD = 2,100 USD

料金例 3 - Analyze Document API – フォームと表

Analyze Document API を使用して 5,000 ページの納税申告書からテキストと構造化データを抽出するとしましょう。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表ありの場合は 0.015 USD、フォームありの場合は 0.05 USDで、合計 325 USD です。

処理する総ページ = 5,000 ページ

表付きページの料金 = 0.015 USD

フォーム (キーと値のペア) を含むページの料金 = 0.05 USD

合計料金 = 0.015 USD × 5,000 + 0.05 USD × 5,000 = 75 USD + 250 USD = 325 USD

料金例 4 - Analyze Document API – フォームと表

Analyze Document API を使用して、200 万ページの納税申告書からテキスト、フォーム、表を抽出したいとします。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表ありの場合は 0.015 USD、100 万ページ以降は 0.01 USD となります。フォーム付きのページは、100 万ページで 0.05 USD、100 万ページ以降は 1 ページあたり 0.04 USD となります。総コストは 115,000 USD となります。

処理する総ページ = 2,000,000 ページ

フォーム (キーと値のペア) を含むページの料金 = 最初の 100 万ページまでは 0.05 USD、次の 100 万ページは 0.04 USD

合計料金 = 0.015 USD × 1,000,000 + 0.01 USD × 1,000,000 + 0.05 USD × 1,000,000 + 0.04 USD × 1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD

料金例 5 - Analyze Document API - クエリ

Analyze Document API を使用して 5,000 ページの住宅ローンフォームからテキストを抽出するとしましょう。また、クエリを介して各ページから 10 個の特定のデータポイントを抽出したいとします。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は 0.015 USDで、合計 75 USD です。

処理する総ページ = 5,000 ページ

クエリによる 1 ページあたりの料金 = 0.015 USD

合計料金 = 0.015 USD × 5,000 = 75 USD

料金例 6 – Analyze Document API – フォームとテーブルとクエリ

Analyze Document API を使用して、200 万ページの給与明細からテキスト、フォーム、表を抽出するとします。また、クエリを介して各ページから 10 個の特定のデータポイントを抽出したいとします。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表とフォームとクエリありの場合は 0.070 USD、100 万ページ以降は 0.055 USD となります。総コストは 125,000 USD となります。

処理する総ページ = 2,000,000 ページ 

表、フォーム、およびクエリ付きページの料金 = 最初の 100 万ページまでは 0.070 USD、次の 100 万ページは 0.055 USD 

合計料金 = 0.070 USD × 1,000,000 + 0.055 USD × 1,000,000 = 70,000 USD + 55,000 USD = 125,000 USD

料金例 7 - Analyze Document API - フォームとクエリ

Analyze Document API を使用して、5,000 ページの納税申告書からテキストと表データを抽出するとします。また、クエリを介して各ページから 10 個の特定のデータポイントを抽出したいとします。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表とクエリありの場合は 0.020 USD、100 万ページ以降は 0.015 USD となります。総コストは 100 USD となります。

処理する総ページ = 5,000 ページ

表とクエリ付きページの料金 = 0.020 USD

合計料金 = 0.020 USD × 5,000 = 100 USD

料金例 8 – Analyze Document API – 署名

Analyze Document API - 署名機能タイプを使用して、10 万ページの住宅ローンドキュメントから署名を検出し、生のテキストを抽出するとします
。米国西部 (オレゴン) リージョンにおける最初の 100 万ページでは、ページあたりの料金は 0.0035 USD で、コストは
350 USD となります。
処理する総ページ = 100,000
ページあたりの料金 = 0.0035 USD
1 か月あたりの合計料金 = 0.00035 USD × 100,000 = 350 USD

料金例 9 – Analyze Document API – 署名

Analyze Document API - 署名機能タイプを使用して、500 万ページの住宅ローンドキュメントから署名を検出し、生のテキストを抽出するとします
。米国西部 (オレゴン) リージョンにおける最初の 100 万ページでは、ページあたりの料金は 0.00035 USD で、コストは 20 USD となります。
処理する総ページ = 5000,000
最初の 100 万ページの 1 ページあたりの料金 = 0.0035 USD × 1,000,000 = 3,500 USD
次の 400 万ページの 1 ページあたりの料金 = 0.0014 USD × 4,000,000 = 5,600 USD
合計 = 3,500 USD + 5,600 USD = 9,100 USD

料金例 10 - Analyze Expense API

Analyze Expense API を使用して 10 万件の請求書からデータを抽出すると仮定します。米国西部 (オレゴン) リージョンでは、100 万ページを処理した場合の 1 ページあたりの料金は 0.01 USD で、10 万件の請求書を処理するとします。総コストは 1,000 USD となります。以下の計算をご覧ください。 

処理する総ページ = 100,000 

ページあたりの料金 = 0.01 USD 

1 か月あたりの合計料金 = 0.01 USD × 100,000 = 1,000 USD

料金例 11 - Analyze Expense API

Analyze Expense API を使用して 150 万件の請求書からデータを抽出すると仮定します。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は 0.01 USD、100 万ページ以降は 0.008 USD となります。総コストは 14,000 USD となります。以下の計算をご覧ください。 

処理する総ページ = 1,500,000 

ページあたりの料金 = 最初の 100 万ページまでは 0.01 USD、次の 50 万ページは 0.008 USD 

1 か月あたりの合計料金 = 0.01 USD × 1,000,000 + 0.008 USD × 500,000 = 14,000 USD

料金例 12 - Analyze ID API

Analyze ID API を使用して、10 万件の身分証明書から情報を抽出するとします。米国西部 (オレゴン) リージョンでは、100,000 ページの 1 ページあたりの料金は 0.025 USD、最大 100,000 ページの 1 ページあたりの料金となります。総コストは 2,500 USD となります。 

処理する総ページ = 100,000 

ページあたりの料金 = 0.025 USD 

1 か月あたりの合計料金 = 0.025 USD × 100,000 = 2,500 USD

料金例 13 - Analyze ID API

Analyze ID API を使用して、60 万件の身分証明書から情報を抽出するとします。米国西部 (オレゴン) リージョンでは、100,000 ページの 1 ページあたりの料金は 0.025 USD、100,000 ページ以降は 0.01 USD となります。合計コストは 7,500 USD となります。

処理する総ページ = 600,000

ページあたりの料金 = 最初の 10 万ページまでは 0.025 USD、次の 50 万ページは 0.01 USD

1 か月あたりの合計料金 = 0.025 USD × 100,000 + 0.01 USD × 500,000 = 7,500 USD

料金例 14 – Analyze Lending API

Analyze Lending API を使用して、20 万ページの住宅ローンドキュメントから情報を抽出するとします。米国西部 (オレゴン) リージョンのページあたりの料金は、最大 100 万ページまで、1 ページあたり 0.07 USD です。処理した 20 万ページのうち、Analyze Lending は、サポートするドキュメントタイプの分類と抽出を提供し、その結果、10 万ページの分類とデータ抽出が行われました。合計コストは、その 10 万ページについて 7,000 USD となります。

処理する総ページ = 200,000

分類と抽出についてサポートされる総ページ数 = 100,000

ページあたりの料金 = 0.07 USD

1 か月あたりの合計料金 = 0.07 USD × 100,000 = 7,000 USD

料金例 15 – Analyze Lending API

Analyze Lending API を使用して、200 万ページの住宅ローンドキュメントから情報を抽出するとします。米国西部 (オレゴン) リージョンでのページあたりの料金は、100 万ページまでは 1 ページあたり 0.07 USD、100 万ページを超えると 1 ページあたり 0.055 USD です。処理した 200 万ページのうち、Analyze Lending は、サポートするドキュメントタイプの分類と抽出を提供し、その結果、120 万ページの分類とデータ抽出が行われました。合計コストは、その 120 万ページについて 81,000 USD となります。

処理する総ページ = 2,000,000

分類と抽出についてサポートされる総ページ数 = 1,200,000

ページあたりの料金 = 最初の 100 万ページまでは 0.07 USD、次の 20 万ページは 0.055 USD

1 か月あたりの合計料金 = 0.07 USD × 1,000,000 + 0.055 USD × 200,000 = 81,000 USD

料金例 16 - Analyze Document API – レイアウトとテーブル

Analyze Document API を使用して、200 万ページの財務レポートからレイアウトとテーブルを抽出する必要があります。レイアウトは、テーブル機能と併用すると無料で利用できます。米国西部 (オレゴン) リージョンのテーブルの料金は、1 か月で最初の 100 万ページは 1 ページあたり 0.015 USD、1 か月で 100 万ページを超えると 1 ページあたり 0.010 USD です。

処理する総ページ = 2,000,000 ページ

最初の 100 万ページの料金 = 0.015 USD × 1,000,000 = 15,000 USD

次の 100 万ページの料金 = 0.010 USD × 1,000,000 = 10,000 USD

合計請求額 = 25,000 USD

料金例 17 - Analyze Document API - カスタムクエリ

カスタムクエリを使用して 500 万ページからデータを抽出する必要があります。米国西部 (オレゴン) リージョンの料金は、1 か月で最初の 100 万ページは 1 ページあたり 0.025 USD、1 か月で 100 万ページを超えると 1 ページあたり 0.015 USD です。

処理する総ページ = 5,000,000 ページ

最初の 100 万ページの料金 = 0.025 USD × 1000000 = 25000 USD

次の 400 万ページの料金 = 0.015 USD × 4,000,000 = 60000 USD

合計請求額 = 85,000 USD

料金例 18 - Analyze Document API – 事前トレーニング済みフォームとカスタムクエリ

事前トレーニング済みフォームとカスタムクエリを使用して、200 万ページからデータポイントを抽出する必要があります。米国西部 (オレゴン) リージョンの料金は、1 か月で最初の 100 万ページは 1 ページあたり 0.065 USD、1 か月で 100 万ページを超えるページは 1 ページあたり 0.050 USD です。

処理する総ページ = 2,000,000 ページ

最初の 100 万ページの料金 = 0.065 USD × 1,000,000 = 65,000 USD

次の 100 万ページの料金 = 0.050ドル × 1,000,000 = 50,000 USD

合計請求額 = 115,000 USD

Amazon Textract のよくある質問を確認する

Amazon Textract が実質すべてのドキュメントからテキストおよび構造化データを抽出する方法の詳細

詳細 
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Textract を使った構築を始めましょう。

サインアップ