Amazon Textract

印刷されたテキスト、手書きの文字、およびデータを事実上すべてのドキュメントから簡単に抽出

Amazon Textract は、スキャンされたドキュメントからテキスト、手書きの文字、データを自動抽出する機械学習サービスです。この機能では、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやテーブルのデータも識別、理解したうえで抽出することが可能です。今日、多くの企業が PDF、画像、テーブルやフォームなどのドキュメントから手作業でデータを抽出したり、あるいは手動の設定を必要とする単純な OCR ソフトウェアを使用してスキャンしたドキュメントから手作業でデータを抽出したりしています。(OCR ソフトウェアでフォームの設定変更する際に時間がかかります。)このようなコストがかかる手動のプロセスをなくすために、Textract では機械学習を利用しています。手作業なしで、あらゆる種類のドキュメントを即座に読み取って処理し、テキスト、手書きの文字、テーブルなどのデータを正確に抽出できます。ローンの処理であれ税務文書であれ、即座にドキュメントの処理を自動化し、抽出された情報にアクションを実行できます。数時間、数日かかる手作業とは対照的に、Textract は数分でデータを抽出できます。さらに、Amazon Augmented AI を使用して、人間によるレビューを追加してモデルを監視し、機密データのレビューを実行できます。

1,000 ページ無料

(AWS 無料利用枠で 1 か月あたり)

利点

データ構造を問わない抽出

Amazon Textract は、人工知能を利用して、人間のようにドキュメントを読み、設定やトレーニング、コードのカスタマイズなしでコンテキスト通りにテキスト、レイアウト、テーブル、フォーム、および構造化データを抽出できます。

単純な光学文字認識 (OCR) を超えた機能

Amazon Textract では、フォームのラベルや値を識別したり、テーブルから情報を抽出したりするのに OCR 技術を使用しますが、データの構造が損なわれることはなく、また低コストでご利用いだだけます。使用した分だけ支払えばよく、前払いの義務や長期の契約も不要です。

データのセキュリティとコンプライアンスの選択

Amazon Textract は、Service Organization Control (SOC)、International Organization for Standardization (ISO)、PCI、HIPAA、および GDPR に準拠しているため、お客様は、顧客データを保護するセキュリティプロセスと制御について深いインサイトを得ることができます。さらに、Textract は、AWS Privatelink および KMS を介して Amazon Virtual Private Cloud (VPC) エンドポイントをサポートしているため、お客様はパブリックインターネットの使用を回避してデータを暗号化できます。

人間によるレビューの簡単な実装

Amazon Textract は Amazon Augmented AI (Amazon A2I) と直接統合されているため、ドキュメントから抽出されたテキストの人間によるレビューを簡単に実装できます。あいまいさや機密性があるために人間による監視を必要とするワークフローに対し、人間によるレビューを組み込むことができます。これにより、継続的な予測結果に確信性を付加したり監査を実施したりできます。

ユースケース

金融サービス

金融サービス

住宅ローンの申請書などの金融フォームや源泉徴収票などには、住宅ローン金利、申請者の名前、および税に関する情報などの、抽出および分析する必要がある重要なビジネス情報が含まれる場合があります。Amazon Textract では、スキャンされた文書、テーブルおよびフォームから情報を抽出し、アプリケーションを数分で処理することで、顧客に迅速に対応できます。

ヘルスケアおよびライフサイエンス

ヘルスケアおよびライフサイエンス

Amazon Textract は、数千のヘルスケアおよび保険のフォームをスキャンし、それらのフォームの中から情報を抽出し、整理して元のコンテキストに保持します。手作業で出力をレビューする必要はありません。健康に関する受け入れ票、保険金請求、事前承認用書類から重要な患者データを抽出することで、患者および保険会社により良いサービスを提供できます。

公共部門

公共部門

中小企業ローンの申込書、連邦税の申請書、事業の申請書などの政府関連の書式の処理では、数千時間かけて関連のある重要なデータが手作業で抽出されます。Amazon Textract では、光学文字認識 (OCR) を使用して、スキャンされた画像、PDF、またはスキャンされたドキュメントからでも、すべてのデータを抽出できます。Textract は、それぞれの文字や単語だけではなく、テーブルに保存されているフォームフィールドの内容や情報も、より正確に識別します。

お客様の導入事例

Kabbage

Kabbage は、スモールビジネスにキャッシュフローのためのソリューションを提供している、データとテクノロジーの企業です。そのサービスには、一連のクレジットへの柔軟なアクセス、オンライン決済、キャッシュフローのインサイト、および、ビジネス用小切手の提供などが含まれます。

「当社では、Amazon Textract により、PPP アプリケーションの 80% をサポートしており、貸出業務を完全に自動化しています。さらに、数日間を要していた承認のための時間は、中央値で 4 時間程度にまで短縮しました。この導入プログラムが完了した時点で、当社は、アプリケーションの規模では国内で 2 番目に大きな PPP 資金提供者となり、米国内の主要銀行を上回りました。サービスは 297,000 社を超える中小企業に提供されており、アメリカ全土で、約 945,000 件の雇用維持に寄与しています」

Kabbage のデータサイエンス責任者、Anthony Sabelli 氏

Change Healthcare

Change Healthcare は業界トップの独立系ヘルスケアテクノロジー企業で、米国ヘルスケアシステムにおいて、臨床、金融、患者などの連携の成果を改善するために、データおよび分析主導のソリューションを提供しています。

「Change Healthcare では財務および管理上の決定の予定表と品質を改善することで、すべての人が金銭的にも、物理的にもヘルスケアを利用できるようにすることができると信じています。これはデータからより多くのことを理解するために、機械学習技術の力を用いることで、実現できます。しかし、この情報の潜在能力を解放するのは困難なことが多々あります。こうした情報は従来の光学文字認識機能では分析できない表やフォームに遮られてしまっているためです。Amazon Textract ではテキストに加えて構造化データを取得する機能を使用して、ドキュメントの理解をさらに深めます。これからはサービスが HIPAA 準拠となることで、大量のドキュメントに埋もれている情報を解放し、患者、支払人、供給業者にさらなる価値をもたらすことができるようになります」

Change Healthcare の EVP および チーフ AI オフィサー、Nick Giannasi 氏

Filevine

Filevineは、クラウドベースのケースと案件管理、ドキュメント管理、詳細なレポート分析など、法律専門家向けの運用コアです。2015 年の創業以来、Filevine は急速なイノベーションと受賞歴のあるデザインに焦点を当て、独立したレビューサイトから最高位の評価を得ています。

「数百万の案件やケースのファイルが毎日、Filevine で処理されています。アマゾン ウェブ サービスを選択したのは、お客様のためにクラス最高のドキュメント検索ソリューションを提供したいと考えたためです。Amazon Textract は高速で正確、スケール自在です。このことは、Filevine が世界最大で最も優れた法律組織の要件に合致するために役立ちます。ことわざにあるように、干し草の山から針を探す、つまり検索することは、Filevine と Amazon により、法律の専門家にとってかつてないほど容易になっています」

Filevine の 最高経営責任者、Ryan Anderson 氏

Intuit

Intuit は、TurboTax と QuickBooks を含む革新的な財務管理ソリューションを世界中の約 5,000 万人のお客様に提供しています。

「Intuit の文書理解技術には、AI が使用されており、消費者、中小企業、または自営業者の手作業でのデータ入力が排除されています。この技術は、毎年 TurboTax を利用する数百万人のアメリカ人向けに、金融書類のデータ入力という面倒で時間のかかるタスクを行うことで、税に関する手続きを簡素化します。Textract は、Intuit の文書理解の機能における重要な要素であり、複雑な金融フォームのコンテキストでテキストを分析することで、データ抽出の正確さを向上させます」

Intuit の AI VP、Krithika Swaminathan 氏

Standard Product Icons (Features) Squid Ink
Amazon Textract の機能を確認する

Amazon Textract の機能に関する詳細についてさらに説明します。

詳細 
Sign up for a free account
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Standard Product Icons (Start Building) Squid Ink
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Textract を使った構築を始めましょう。

サインアップ