Amazon Textract

印刷されたテキスト、手書きの文字、およびデータをすべてのドキュメントから簡単に抽出

Amazon Textract は、スキャンされたドキュメントからテキスト、手書きの文字、データを自動抽出する機械学習サービスです。この機能では、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやテーブルのデータも識別、理解したうえで抽出することが可能です。今日、多くの企業が PDF、画像、テーブルやフォームなどのドキュメントから手作業でデータを抽出したり、あるいは手動の設定を必要とする単純な OCR ソフトウェアを使用してスキャンしたドキュメントから手作業でデータを抽出したりしています。(OCR ソフトウェアでフォームの設定変更する際に時間がかかります。)このようなコストがかかる手動のプロセスをなくすために、Textract では機械学習を利用しています。手作業なしで、あらゆる種類のドキュメントを即座に読み取って処理し、テキスト、手書きの文字、テーブルなどのデータを正確に抽出できます。ローンの処理であれ請求書や領収書からの情報抽出であれ、即座にドキュメントの処理を自動化し、抽出された情報にアクションを実行できます。数時間、数日かかる手作業とは対照的に、Textract は数分でデータを抽出できます。さらに、Amazon Augmented AI を使用して、人間によるレビューを追加してモデルを監視し、機密データのレビューを実行できます。

1,000 ページ無料

(AWS 無料利用枠で 1 か月あたり)

利点

データ構造を問わない抽出

Amazon Textract は、人工知能を利用して、人間のようにドキュメントを読み、設定やトレーニング、コードのカスタマイズなしでコンテキスト通りにテキスト、レイアウト、テーブル、フォーム、および構造化データを抽出できます。

単純な光学文字認識 (OCR) を超えた機能

Amazon Textract では、フォームのラベルや値を識別したり、テーブルから情報を抽出したりするのに OCR 技術を使用しますが、データの構造が損なわれることはなく、また低コストでご利用いだだけます。使用した分だけ支払えばよく、前払いの義務や長期の契約も不要です。

データのセキュリティとコンプライアンスの選択

Amazon Textract は、Service Organization Control (SOC)、International Organization for Standardization (ISO)、PCI、HIPAA、および GDPR に準拠しているため、お客様は、顧客データを保護するセキュリティプロセスと制御について深いインサイトを得ることができます。さらに、Textract は、AWS Privatelink および KMS を介して Amazon Virtual Private Cloud (VPC) エンドポイントをサポートしているため、お客様はパブリックインターネットの使用を回避してデータを暗号化できます。

人間によるレビューの簡単な実装

Amazon Textract は Amazon Augmented AI (Amazon A2I) と直接統合されているため、ドキュメントから抽出されたテキストの人間によるレビューを簡単に実装できます。あいまいさや機密性があるために人間による監視を必要とするワークフローに対し、人間によるレビューを組み込むことができます。これにより、継続的な予測結果に確信性を付加したり監査を実施したりできます。

ユースケース

金融サービス

金融サービス

住宅ローンの申請書などの金融フォームや源泉徴収票、請求書などには、住宅ローン金利、申請者の名前、請求書の合計、および税に関する情報などの、抽出および分析する必要がある重要なビジネス情報が含まれる場合があります。Amazon Textract では、スキャ ンされた文書や PDF、テーブルおよびフォームを含む画像から情報を抽出し、アプリケーションを数分で処理することで、顧客に迅速に対応できます。

ヘルスケアおよびライフサイエンス

ヘルスケアおよびライフサイエンス

Amazon Textract は、数千のヘルスケアおよび保険のフォームをスキャンし、それらのフォームの中から情報を抽出し、整理して元のコンテキストに保持します。手作業で出力をレビューする必要はありません。健康に関する受け入れ票、保険金請求、事前承認用書類から重要な患者データを抽出することで、患者および保険会社により良いサービスを提供できます。

公共部門

公共部門

中小企業ローンの申込書、連邦税の申請書、事業の申請書などの政府関連の書式の処理では、数千時間かけて関連のある重要なデータが手作業で抽出されます。Amazon Textract では、光学文字認識 (OCR) を使用して、スキャンされた画像、PDF、またはスキャンされたドキュメントからでも、すべてのデータを抽出できます。Textract は、それぞれの文字や単語だけではなく、テーブルに保存されているフォームフィールドの内容や情報も、より正確に識別します。

お客様の導入事例

Kabbage

Foresight Group は、戦略的に多様な家族経営企業であり、未来へのレガシーを築いています。同 Group は、ショッピング、海洋掘削、港湾およびガスインフラストラクチャ、ならびにインドを中心としたプライベートエクイティ投資に重点を置き、数十年かけてグローバルビジネスコングロマリットに変身しました。

SAP での請求書の処理を自動化したいと思っていました。現在、手動で請求書を処理しており、請求書ごとに 15~20 分かかります。AP チームメンバーは、メールから添付ファイルを取得し、請求書から手動で抽出して、データを複数の会計システムに入力します。最初は、自動化に懐疑的でした。しかし、パートナーの InfraBeat は、いくつかの OCR ソリューションを評価しました。 InfraBeat は、Amazon Textract に決め、高レベルの精度と自社のロジックへの最小限の調整を実現するために、Amazon Textract ソリューションを備えたSAP IRPA を提案しました。当社は、データ抽出に関して常に高精度を求めていますが、Amazon Textract の結果は予想を上回り、さまざまなレイアウトで一貫しており、すべての請求書を通して90%の精度を実現しています」。 

グループ IT、Foresight Group

Change Healthcare

Change Healthcare は業界トップの独立系ヘルスケアテクノロジー企業で、米国ヘルスケアシステムにおいて、臨床、金融、患者などの連携の成果を改善するために、データおよび分析主導のソリューションを提供しています。

「Change Healthcare では財務および管理上の決定の予定表と品質を改善することで、すべての人が金銭的にも、物理的にもヘルスケアを利用できるようにすることができると信じています。これはデータからより多くのことを理解するために、機械学習技術の力を用いることで、実現できます。しかし、この情報の潜在能力を解放するのは困難なことが多々あります。こうした情報は従来の光学文字認識機能では分析できない表やフォームに遮られてしまっているためです。Amazon Textract ではテキストに加えて構造化データを取得する機能を使用して、ドキュメントの理解をさらに深めます。これからはサービスが HIPAA 準拠となることで、大量のドキュメントに埋もれている情報を解放し、患者、支払人、供給業者にさらなる価値をもたらすことができるようになります」

Change Healthcare の EVP および チーフ AI オフィサー、Nick Giannasi 氏

Filevine

Filevineは、クラウドベースのケースと案件管理、ドキュメント管理、詳細なレポート分析など、法律専門家向けの運用コアです。2015 年の創業以来、Filevine は急速なイノベーションと受賞歴のあるデザインに焦点を当て、独立したレビューサイトから最高位の評価を得ています。

「数百万の案件やケースのファイルが毎日、Filevine で処理されています。アマゾン ウェブ サービスを選択したのは、お客様のためにクラス最高のドキュメント検索ソリューションを提供したいと考えたためです。Amazon Textract は高速で正確、スケール自在です。このことは、Filevine が世界最大で最も優れた法律組織の要件に合致するために役立ちます。ことわざにあるように、干し草の山から針を探す、つまり検索することは、Filevine と Amazon により、法律の専門家にとってかつてないほど容易になっています」

Filevine の 最高経営責任者、Ryan Anderson 氏

Intuit

Intuit は、TurboTax と QuickBooks を含む革新的な財務管理ソリューションを世界中の約 5,000 万人のお客様に提供しています。

「Intuit の文書理解技術には、AI が使用されており、消費者、中小企業、または自営業者の手作業でのデータ入力が排除されています。この技術は、毎年 TurboTax を利用する数百万人のアメリカ人向けに、金融書類のデータ入力という面倒で時間のかかるタスクを行うことで、税に関する手続きを簡素化します。Textract は、Intuit の文書理解の機能における重要な要素であり、複雑な金融フォームのコンテキストでテキストを分析することで、データ抽出の正確さを向上させます」

Intuit の AI VP、Krithika Swaminathan 氏

Standard Product Icons (Features) Squid Ink
Amazon Textract の機能を確認する

Amazon Textract の機能に関する詳細についてさらに説明します。

詳細 
Sign up for a free account
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Standard Product Icons (Start Building) Squid Ink
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Textract を使った構築を始めましょう。

サインアップ