Amazon Textract は、光学文字認識 (OCR) を使用して、PDF などのスキャンしたドキュメントからテキスト、手書き文字、データを自動的に抽出する機械学習 (ML) サービスです。Amazon Textract では、使用した分のみ料金が発生します。最低料金や前払いの義務はありません。Amazon Textract は、テキスト、テーブル付きテキスト、フォームデータのいずれを抽出しても、処理されたページに対してのみ課金されます。ページおよび Textract の利用規約の詳細についてはよくある質問をご覧ください。

Amazon Textract には、Detect Document Text API、Analyze Document API、Analyze Expense API の 3 つの異なる API があります

Detect Document Text API は、OCR テクノロジーを使用して、提供されたドキュメントからテキストと手書き文字を抽出します。米国西部 (オレゴン) リージョンでは、最初の 100 万ページまでは 1 ページあたり 0.0015 USD、100 万ページを超えると 1 ページあたり 0.0006 USD を支払います。

Analyze Document API にはフォームと表の 2 つの機能があり、料金設定も異なります。

  • フォーム用 Analyze Document API は、OCR テクノロジーを使用して、提供されたドキュメントからテキストと手書き文字を抽出します。また、キーと値のペア (「First Name」と関連する値:「Jane Smith」) のようなデータも抽出します。米国西部 (オレゴン) リージョンでは、最初の 100 万ページまでは 1 ページあたり 0.05 USD、100 万ページを超えると 1 ページあたり 0.04 USD を支払います。
  • 表用 Analyze Document API は、OCR テクノロジーを使用して、提供されたドキュメントからテキストと手書き文字を抽出します。また、列や行で構成された表形式、または表のデータを抽出することもできます。米国西部 (オレゴン) リージョンでは、最初の 100 万ページまでは 1 ページあたり 0.015 USD、100 万ページを超えると 1 ページあたり 0.01 USD を支払います。
 
Analyze Expense API は、請求書や領収書からデータを抽出します。例えば、請求書や領収書には、請求書 ID、請求書 No.、請求書 # などのデータが含まれることがあり、関連する値として 12345 があります。Amazon Textract は、これらの様々な条件を請求書 ID として認識し、対応する値を 12345 として認識しますので、一般的なフィールドの標準的なタクソノミーを実現します。米国西部 (オレゴン) リージョンでは、最初の 100 万ページまでは 1 ページあたり 0.01 USD、100 万ページを超えると 1 ページあたり 0.008 USD を支払います。

無料利用枠

Amazon Textract は AWS 無料利用枠に含まれており、無料で使用開始できます。無料利用枠は 3 か月間で、新規に AWS をご利用になるお客様は、Detect Document Text API を使用して月に 1,000 ページまで、Analyze Document API または Analyze Expense API を使用して月に 100 ページまでの分析が可能です。

Amazon Textract API の料金

Detect Document Text API (OCR)


表を含むページに対する Analyze Document API

* 表は、列と行に視覚的に整理された関連データの集合です。例えば、工場の日々の生産量を確認するオペレーションログなどです。


フォームを含むページに対する Analyze Document API

* フォームは、同じページにある独立したキーと値の集合です (例: W2)。


表とフォームを含むページに対する Analyze Document API


請求書や領収書を分析する Analyze Expense API

無料利用枠を超えた料金の例

料金例 1 - Detect Document Text API

Detect Document Text API を使用して 100,000 ページの研究レポートからテキストを抽出するとしましょう。米国西部 (オレゴン) リージョンでの最初の 100 万ページに対する 1 ページあたりの料金は 0.0015 USD なので、10 万ページを処理する場合、1 か月あたりのコストは合計 150 USD となります。以下の計算をご覧ください。

処理する総ページ = 100,000

ページあたりの料金 = 0.0015 USD

月あたりの合計料金 = 0.0015 USD × 100,000 = 150 USD

料金例 2 - Detect Document Text API

Detect Document Text API を使用して 200 万ページの研究レポートからテキストを抽出するとしましょう。米国西部 (オレゴン) リージョンでの 1 ページあたりの料金は、最初の100 万ページまでは 0.0015 USD、100 万ページ以降は 0.0006 USD となっており、200 万ページを処理する場合の総コストは 2,100 USD となります。以下の計算をご覧ください。

処理する総ページ = 2,000,000

ページあたりの料金 = 最初の 100 万ページまでは 0.0015 USD、100 万ページを超える分は 0.0006 USD

月あたりの合計料金 = 0.0015 USD × 1,000,000 + 0.0006 USD × 1,000,000 = 1,500 USD + 600 USD = 2,100 USD

料金例 3 - Analyze Document API – フォームと表

Analyze Document API を使用して 5,000 ページの納税申告書からテキストと構造化データを抽出するとしましょう。 米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表ありの場合は 0.015 USD、フォームありの場合は 0.05 USDで、合計 325 USD です。以下の計算をご覧ください。

処理する総ページ = 5,000 ページ

表付きページの料金 = 0.015 USD

フォーム (キーと値のペア) を含むページの料金 = 0.05 USD

合計料金 = 0.015 USD × 5,000 + 0.05 USD × 5,000 = 75 USD + 250 USD = 325 USD

料金例 4 - Analyze Document API – フォームと表

Analyze Document API を使用して、200 万ページの納税申告書からテキスト、フォーム、表を抽出したいとします。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は、表ありの場合は 0.015 USD、100 万ページ以降は 0.01 USD となります。フォーム付きのページは、100 万ページで 0.05 USD、100 万ページ以降は 1 ページあたり 0.04 USD となります。総コストは 115,000 USD となります。以下の計算をご覧ください。

処理する総ページ = 2,000,000 ページ

表付きページの料金 = 最初の 100 万ページまでは 0.015 USD、次の 100 万ページは 0.01 USD

フォーム (キーと値のペア) を含むページの料金 = 最初の 100 万ページまでは 0.05 USD、次の 100 万ページは 0.04 USD

合計料金 = 0.015 USD × 1,000,000 + 0.01 USD × 1,000,000 + 0.05 USD × 1,000,000 + 0.04 USD × 1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD

料金例 5 - Analyze Expense API

Analyze Expense API を使って 10 万件の請求書からデータを抽出するとしましょう。米国西部 (オレゴン) リージョンでは、100 万ページを処理した場合の 1 ページあたりの料金は 0.01 USD で、10 万件の請求書を処理するとします。総コストは 1,000 USD となります。以下の計算をご覧ください。

処理する総ページ = 100,000

ページあたりの料金 = 0.01 USD

月あたりの合計料金 = 0.01 USD × 100,000 = 1,000 USD

料金例 6 - Analyze Expense API

Analyze Expense API を使って 150 万件の請求書からデータを抽出するとしましょう。米国西部 (オレゴン) リージョンでは、100 万ページの 1 ページあたりの料金は 0.01 USD、100 万ページ以降は 0.008 USD となります。総コストは 14,000 USD となります。以下の計算をご覧ください。

処理する総ページ = 1,500,000

ページあたりの料金 = 最初の 100 万ページまでは 0.01 USD、次の 50 万ページは 0.008 USD

月あたりの合計料金 = 0.01 USD × 1,000,000 + 0.008 USD × 500,000 = 14,000 USD

Standard Product Icons (Features) Squid Ink
Amazon Textract のよくある質問を確認する

Amazon Textract が実質すべてのドキュメントからテキストおよび構造化データを抽出する方法の詳細

詳細 
Sign up for a free account
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Standard Product Icons (Start Building) Squid Ink
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Textract を使った構築を始めましょう。

サインアップ