投稿日: Jun 23, 2021

Amazon Textract は、スキャンされたドキュメントからテキスト、手書きの文字、データを自動抽出する機械学習サービスです。この機能では、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやテーブルのデータも識別、理解したうえで抽出することが可能です。お客様のフィードバックに基づいて、基盤となる機械学習モデルを継続的に改善し、さらに高い精度を提供します。本日、フォーム抽出機能の精度向上のためのアップデートを行いましたのでお知らせします。本日より、Textract はドキュメントやイメージ内のチェックボックスとキーバリューペアをより正確に検出します。領収書と請求書についての精度は特に向上していますが、お客様は金融、医療、法務、公共部門、その他の多くのドキュメントで改善を目にするでしょう。

このアップデートは、6 月 23 日にアジアパシフィック (シドニー) とアジアパシフィック (シンガポール) で提供が開始され、その後、6 月 24 日に欧州 (アイルランド)、欧州 (パリ)、欧州 (フランクフルト)、欧州 (ロンドン)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ)、6 月 28 日にカナダ (中部)、米国西部 (北カリフォルニア)、米国東部 (オハイオ)、GovCloud (米国西部)、GovCloud (米国東部)、6 月 29 日に米国東部 (バージニア北部)、米国西部 (オレゴン) で順次提供が開始されます。