投稿日: Apr 3, 2023

Amazon Textract は、スキャンしたドキュメントからテキスト、手書き文字、データを自動的に抽出するマネージド型機械学習サービスです。基盤となる機械学習モデルの精度を定期的に改善し、ユーザーからのフィードバックに基づいて新機能を追加しています。本日より、文書処理ワークフローの自動化に役立つ AnalyzeDocument - Tables 機能に新機能が追加され、精度が強化されました。 

新しいテーブルモデルの更新により、文書の表形式構造によく見られる 4 つの新しい要素 (テーブルタイトル、セクションタイトル、テーブルフッター、サマリーセル) のサポートが追加されました。ユーザーはこれらの要素を表形式の構造から直接抽出できるため、複雑な後処理コードの作成と保守にかかる時間を節約できます。さらに、テーブルのタイプを識別する方法も提供されます。最後に、保険、金融サービス、住宅ローン、製造業でよく見られる文書の全体的な精度が向上したことをお知らせします。 

この更新は、米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国東部、米国西部) の各リージョンで利用できます。

使用開始にあたっては、Amazon Textract コンソールにログオンして新機能をお試しください。Textract の機能の詳細については、Amazon Textract のウェブサイト開発者ガイド、またはリソースページにアクセスしてください。