Amazon Web Services ブログ

re:Invent 2018 / Andy Jassy Keynote / Amazon Textract

Amazon Textractがアナウンスされました。

Amazon Textract

スキャンされたドキュメントからテキストとデータを自動的に抽出するサービスです。Amazon Textractは、単純な光学式文字認識(OCR)を超えて、テーブルに格納されたフォームや情報のフィールドの内容も識別するサービスです。

機械学習を使用して、手作業やカスタムコードを必要とせずに、テキストやデータを正確に抽出するためにあらゆる種類の文書を即座に「読む」ことができるようになります。Textractを使用すると、ドキュメントワークフローを迅速に自動化できるため、何百万ものドキュメントページを数時間で処理できます。情報が取り込まれると、ビジネスアプリケーション内で情報を処理して、ローン申請または医療請求処理の次のステップを開始できます。さらに、スマート検索インデックスの作成、承認済みワークフローの自動作成、文書のアーカイブルールへの準拠を維持するために、修正が必要なデータにフラグを立てることができます。

ユースケース
スマート検索インデックスの作成

Amazon Elasticsearch Serviceを使用して、構造化されたデータをドキュメントから抽出し、スマートなインデックスを作成し、数百万件の財務諸表をすばやく検索できるようにします。たとえば、住宅ローン会社はAmazon Textractを使用して数百万のスキャンローンアプリケーションを数時間で処理し、抽出されたデータをAmazon Elasticsearchで索引付けすることができます。これにより、「申請者名がJohn Doeのローン申請の検索」や「金利が2%の検索契約」などの検索エクスペリエンスを作成できます。

自動化されたドキュメント処理ワークフローの構築

Amazon Textractは、人間の介入なしにフォームを自動的に処理するために必要な入力を提供できます。たとえば、銀行は融資申し込みのPDFを読むためのコードを書くことができます。文書に記載されている情報は、顧客が手作業によるレビューと検証のために数日待つ必要はなく、アプリケーションの即時結果を得るために、ローンを承認するために必要なバックグラウンドとクレジットチェックを開始するために使用できます。

 

– プロダクトマーケティング エバンジェリスト 亀田