投稿日: Nov 28, 2018

Amazon Textract は、電子化したドキュメントからテキストとデータを自動抽出するサービスです。Amazon Textract では、単純な光学文字認識 (OCR) のレベルを超え、フォーム内のフィールドの入力内容や、テーブルに保存された情報も識別されます。

現在、多くの企業ではドキュメントやフォームからデータの手動入力でデータを抽出していますが、速度が遅くコストもかかります。単純な OCR ソフトウェアを使用した場合でも、多くの場合不正確であるため、抽出されたコンテンツを開発者がアプリケーションで使用できるフォーマットにしようとすると、出力内容に対する膨大な後処理が必要になります。Amazon Textract では、機械学習を使用し、実質的にどのような種類のドキュメントでも即座に読み取ってテキストやデータを正確に抽出できます。手動レビューやカスタムコードは必要ありません。Amazon Textract によって、開発者はドキュメントワークフローをすばやく自動化でき、数百万ページのドキュメントでも数時間で処理できます。

Amazon Textract の使用を開始するには、こちらでプレビューアクセスにサインアップし、こちらで今後のオンラインセミナーに登録してください。