ドキュメントのタイプや形式はさまざまで、価値ある情報が含まれています。 ほとんどの場合、これらのドキュメントを手作業で処理していますが、時間がかかり、エラーが発生しやすく、コストもかかります。この情報が迅速に必要なだけでなく、ダウンストリームアプリケーション向けにこれらのドキュメント内の情報を使用する必要があることも考えられます。
このような課題を克服するために、AWS Machine Learning (ML) は、保険申請、住宅ローン、医療費請求、契約書、法的契約書など、あらゆるドキュメント形式の複雑なコンテンツから情報を抽出する際の選択肢を提供します。
利点

データの精度を高める
機械学習を使用すると、ドキュメントをより速く、より正確に処理し、手動入力によって発生するエラーを減らすことができます。データが 100% 正確である必要がある場合は、いつでも人の手を介してデータを確認します。

データ処理を高速化
インテリジェントドキュメント処理を実装すると、数週間または数か月かかるはずの作業を数日で完了できます。

従業員の生産性の向上
機械学習により、ドキュメントからインサイトを取り出してさまざまなシステムに情報を入力するという手動のプロセスが不要になり、従業員は付加価値のあるビジネスタスクにより多くの時間を費やすことができます。

コスト削減
ドキュメントワークフローの自動化により、データ抽出と分析の複雑さが軽減され、
ドキュメントあたりの平均コストを低減します。
業種
銀行
住宅ローンのパッケージには、税務申告書、W-2、給与明細、申請書など、さまざまな種類のドキュメントが含まれており、それらを分割、および分類する必要があることが多いです。機械学習では、光学文字認識 (OCR) と自然言語処理 (NLP) を組み合わせて、住宅ローンの申請書から資産評価、クレジットスコア、資産価値などの最も重要な情報を抽出し、顧客への対応を迅速化することができます。
保険
多くの保険のフォームは、レイアウトやフォーマットが多様であるため、テキストの抽出が困難です。機械学習を利用することで、ドキュメントの一部から修理見積もり、物件の住所、ケース ID などの関連フィールドを抽出したり、ドキュメントを簡単に分類したりすることができます。テキスト抽出と NLP を組み合わせることで、保険見積書、バインダー、ACORD フォーム、保険申請フォームなどの保険のフォームを、より速く、より高い精度で処理することができます。
キャピタルマーケット
財務委任状、SEC 提出書類 (10-K、8-K、14A、497K など)、KYC フォーム、税務ドキュメントなどは、高密度のテキスト形式であったり、表やテキストが混在していたりするため、従来の方法では処理が困難でした。AWS ML を使用すると、OCR と NLP を組み合わせてさまざまなフォーマットやファイル形式を処理し、表形式の抽出やドキュメントからエンティティの導出、カスタムモデルを使用してエンティティの認識やドキュメントの分類を行うことができます。
ヘルスケア
多くのヘルスケアフォームには、自由形式のテキスト、密集した段落、チェックボックス、テーブルなどがあります。 機械学習を使って、レイアウトに関係なくこれらのドキュメントから必要なデータを抽出します。 フォームとテーブルの抽出 API と自然言語処理を使用することで、テキスト抽出を活用するだけでなく、医療フォームから医療用語を抽出し、患者や加入者に迅速な結果を提供することができます。
製造
部品表 (BOM)、分析証明書 (COA)、発注書 (PO) は、製造オペレーションの主要な部分であり、今日では通常、手作業で時間をかけて行われています。AI を使えば、契約書からテキストを抽出し、特定のフィールドや値を特定することでプロセスを自動化し、そのデータを製造システムの下流のシステムに通知することができます。
石油とガス
何世紀にもわたる記録が残されています。それらのドキュメントには、圧力テストの記録やメンテナンスの記録など、ビジネスオペレーションのさまざまな部分に関する価値ある情報が含まれています。 ドキュメントにはテキストと画像が混在しているため、ドキュメントパイプラインの構築は困難です。コンピュータビジョンを使用して、ドキュメントからテキストを抽出し、ページの図表や画像を抽出するカスタムパイプラインを構築することで、これらのドキュメントを 1 つずつ確認するという手作業のプロセスを軽減することができます。
クロスインダストリー
法務関連
契約書、裁判所への提出書類、訴訟記録などのドキュメントを処理することは、リーガルチームにとって困難なタスクです。契約文書は、標準化されていないフォーマットであることが多いからです。法的書類を確認するための一般的なワークフローでは、ドキュメントのローディング、読み取り、ケース番号、当事者、法的エンティティの抽出が行われ、何時間もの手作業が必要となります。 OCR と NLP を使用してテキストや特定の用語を抽出することで、このプロセスを自動化し、より高い精度を得ることができます。
未払い金
請求書や領収書はすべての組織にとって不可欠なものですが、これらのドキュメントはさまざまなレイアウトで作成されていることが多いです。機械学習を利用することで、これらのドキュメントの中から価値ある情報を自動的に抽出し、ビジネスの自動化、1 ページあたりのコスト削減、手作業の軽減を図ることができます。
インテリジェントドキュメント処理パートナー
AWS は、機械学習によるドキュメント処理のワークフローをさまざまな業界に適用する深い専門知識を持つパートナーチームを編成しました。AWS パートナーが提供する AWS のインテリジェントドキュメント処理ソリューションは、コストの削減、収益の増加、エンゲージメントの向上に役立つターンキーソリューションです。パートナーのページでは、お客様のユースケースに合ったパートナーソリューションを見つけることができます。
リソース
機械学習を使用してドキュメントの処理と分析の課題を大規模に克服する方法を学ぶ
AWS を使用してエンドツーエンドのインテリジェントドキュメント処理ソリューションを構築する
Document Understanding (DUS) ソリューションの詳細