Amazon Textract

実質的にどのドキュメントからでもテキストやデータを簡単に抽出
Amazon Textract は、電子化したドキュメントからテキストとデータを自動抽出するサービスです。Amazon Textract では、単純な光学文字認識 (OCR) のレベルを超え、フォーム内のフィールドの入力内容や、テーブルに保存された情報も識別されます。

現在、多くの企業ではドキュメントやフォームから手動入力によりデータを抽出していますが、これには時間もコストもかかります。シンプルな光学文字認識 (OCR) ソフトウェアには、手動でのカスタマイズまたは設定が必要です。多くの場合、各ドキュメントやフォームのルールおよびワークフローはハードコード化して、フォームを変更するたびに更新したり、複数のフォームに対応したりする必要があります。フォームがルールを逸脱すると、出力が混乱し、使用できない場合があります。

Amazon Textract では、機械学習を使用し、実質的にどのような種類のドキュメントでも即座に「読み取って」テキストやデータを正確に抽出できるため、これらの課題を解決できます。手動での作業やカスタムコードは必要ありません。Textract を使用すると、ドキュメントのワークフローを迅速に自動化でき、何百万ページものドキュメントも数時間で処理できます。情報を取得したら、使用しているビジネスアプリケーション内でアクションを実行し、ローンの申し込みや医療請求を処理する次のステップを開始できます。さらに、Smart Search インデックスを作成し、自動承認ワークフローを構築できるほか、改定が必要になる可能性のあるデータにフラグを付けてドキュメントアーカイブルールに対するコンプライアンスを維持しやすくできます。

Amazon Textract の紹介 (3:04)

利点

データを迅速かつ正確に抽出

Amazon Textract では、ドキュメント、フォーム、テーブルから簡単、迅速、正確にデータを抽出できます。Amazon Textract はドキュメントのレイアウトやページの主要な要素を自動的に検出し、埋め込まれているあらゆるフォームやテーブルでのデータリレーションシップを識別し、そのコンテンツを維持したまますべてを抽出します。つまり、複雑なコードを介さなくても、抽出したデータをすぐにアプリケーションで使用したりデータベースに保存したりできます。



コードまたはテンプレートの維持が不要

Amazon Textract の事前トレーニング済みの機械学習モデルは、ほぼすべての業界の契約書、税務書類、販売注文書、登録フォーム、給付金申請書、保険金請求書、ポリシードキュメントやその他多数の何千万ものドキュメントですでにトレーニングされているため、データ抽出用のコードを作成する必要がなくなります。受信するすべてのドキュメントやフォームのコードを維持したり、時とともに変化するページレイアウトについて心配しなくても済むようになります。

ドキュメントの処理コストを削減

Amazon Textract は、OCR および構造化されたデータ抽出 (フォームとテーブル) を極めて低いコストで提供します。お支払いいただくのは実際に使用した分のみです。初期費用や長期契約の必要はありません。Amazon Textract のテキスト抽出 API を使用すると、何百万もの文書を簡単に処理できます。

ユースケース

Smart Search インデックスを作成する

構造化されたデータをドキュメントから抽出してスマートインデックスを作成すると、数百万もの財務諸表をすばやく検索できます。例えば、住宅ローン会社は Amazon Textract を使用してスキャンされた数百万件ものローン申し込みを数時間で処理し、抽出データを Amazon Elasticsearch でインデックス化できます。これにより、「申請者名が John Doe のローン申し込み」や「金利が 2% の契約」などで検索できるようになります。

ドキュメントの自動処理ワークフローを構築する

Amazon Textract ではフォームの自動処理に必要な入力を、人間の手を介さずに実行できます。たとえば、銀行は Amazon Textract を使用してローン申請を自動化できます。お客様が申し込みの結果を即座に確認できるように、ドキュメントに含まれる情報を使用して、ローンの承認に必要なすべての経歴確認や信用調査を行います。手作業による確認や検証が終わるまで何日も待たされることはありません。

ドキュメントアーカイブでコンプライアンスを維持する

Amazon Textract はデータタイプとフォームラベルを自動的に識別するため、情報統制に対するコンプライアンスを簡単に維持できます。例えば、保険会社は Amazon Textract を使用して、請求書フォームをアーカイブする前に、保護が必要で重要なキーと値のペアを自動的に識別し、該当するレビューの個人識別情報 (PII) を自動編集するワークフローをフィードできます。

お客様の導入事例

600x400-cambia-health-solutions_logo

Cambia Health Solutions は総合健康ソリューション企業で、オレゴン、アイダホ、ユタ、およびワシントンで 260 万人の会員にサービスを提供する保険会社、Regence など、6 地域の健康保険プラン企業の親会社です。

「過去 100 年間以上、Cambia は人々とその家族のためヘルスケアを改善することに専念してきました。この目的を達成するため、私たちは常にケアの連携を最高に高められるよう、新しいイノベーションとチャンスの価値を検討しています。私たちが力を注ぐ分野の一つは、膨大な時間と作業を要する配信管理プロセスです。紙媒体から正確かつ効率的に価値あるデータを抽出するプロセスの自動化に、Amazon Textract を活用する手立てを探っています。データ科学と AI という強力なコンビネーション、そして人に重点を置いたアプローチがヘルスケアシステムを変革するという私たちのミッションにおいて極めて重要です」

Cambia Health Solutions、チーフアーティフィシャルインテリジェンスオフィサー、Faraz Shafiq 氏


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare は業界トップの独立系ヘルスケアテクノロジー企業で、米国ヘルスケアシステムにおいて、臨床、金融、患者などの連携の成果を改善するために、データおよび分析主導のソリューションを提供しています。

「Change Healthcare では財務および管理上の決定の予定表と品質を改善することで、すべての人が金銭的にも、物理的にもヘルスケアを利用できるようにすることができると信じています。これはデータからより多くのことを理解するために、機械学習技術の力を用いることで、実現できます。しかし、この情報の潜在能力を解放するのは困難なことが多々あります。こうした情報は従来の光学文字認識機能では分析できない表やフォームに遮られてしまっているためです。 Amazon Textract はテキストに加えて構造化データを取得する機能を使用して、ドキュメントの理解をさらに深め、そして、これからはサービスが HIPAA 準拠となることで、大量のドキュメントに埋もれている情報を解放し、患者、支払人、供給業者にさらなる価値をもたらすことができるようになります」

Change Healthcare、EVP、チーフ AI オフィサー、Nick Giannasi 氏


CD_2018_Primary_Logo_w_TM

ClearDATA が提供するソリューションおよびサービスのイノベーティブなプラットフォームは、データのプライバシーにまつわるリスクからお客様を保護し、データ管理を改善。さらに、ヘルスケアの IT インフラを拡張して、毎日のヘルスケアの提供を改善することで、業界全体がヘルスケアの改善に力を注ぐことができるようにします。

「機械学習によって強化された光学文字認識サービス、Textract を AWS が HIPAA 適格サービスに追加するのが大変楽しみです。支払人と供給業者との間で共有されている大量の医療データは、PDF のような画像ベースのファイルに埋め込まれています。この種のデータを手作業で処理する代わりに、今後、ヘルスケア組織はこれまで機械では判読不能だったファイルから、Amazon Textract サービスを使用することにより、医療データを抽出できるようになります。このサービスのおかげで、この種のデータを電子的なカルテにまとめたり、データセット上で保護された健康情報を特定できる Amazon Comprehend Medical といった他のクラウド技術と統合できる機会が生まれます。これはデータへのアクセスを改善し、データからより詳しい情報を取り出し、コストを削減し、患者と関係者の体験を改善するために、こうした新進の技術を活用する機会を増やすための一歩に過ぎません」

ClearDATA のチーフテクロノロジーオフィサー、Matt Ferrari 氏

Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon Textract の機能を確認する

Amazon Textract の機能に関する詳細についてさらに説明します。

詳細 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Product-Page_Standard-Icons_03_Start-Building_SqInk
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Textract を使った構築を始めましょう。

サインアップ