投稿日: Nov 2, 2022

Amazon Textract は、あらゆるドキュメントまたは画像からテキスト、手書き文字、およびデータを自動的に抽出する機械学習サービスです。お客様のフィードバックをもとに、基盤となる機械学習モデルを継続的に改善することで、さらに高い精度を実現します。AnalyzeDocument API を介して利用できるテキストおよびフォーム抽出機能の品質を改善したことを本日発表します。

Amazon Textract はキーと値のペアの抽出の精度を向上させ、特に税金や入国審査の文書で通常見られる、1 文字のボックス型フォームに対応できるようになりました。これらの文書では、単語がボックスに取り込まれる方法が複雑なことから、従来、情報を抽出するのが困難でした。Textract はこれらの 1 文字のボックス型フォームに関する知識を活用して、キーと値のペアの抽出で高い精度を実現できるようになりました。

さらに、AnalyzeDocument API を介した、預金小切手で通常見られる E13B フォントのサポート、銀行の文書に記載されている国際銀行の口座番号、および長い単語 (メールアドレスなど) の検出精度の向上を発表します。保険、ヘルスケア、銀行といった業界のユーザーには、ビジネスプロセスでこれらの文書を活用して Textract の Analyze Document API を使用する際、自動的にこのアップデートの利点がもたらされます。

この更新は米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国東部、米国西部) リージョンで 10 月 31 日から利用可能になります。

使用を開始するには、Amazon Textract コンソールにログオンして新機能をお試しください。Textract の機能の詳細については、Amazon Textract のウェブサイトデベロッパーガイド、またはリソースページにアクセスしてください。