投稿日: Jul 8, 2021

Amazon Textract は、スキャンされたドキュメントからテキスト、手書きの文字、データを自動抽出する機械学習サービスです。この機能では、単純な光学文字認識 (OCR) のレベルにとどまらず、フォームやテーブルのデータも識別、理解したうえで抽出することが可能です。お客様のフィードバックに基づいて、基盤となる機械学習モデルを継続的に改善し、さらに高い精度を提供します。本日、手書き抽出機能の精度向上のためのアップデートを行いましたのでお知らせします。本日より、金融、医療、法務、公共部門などの多くのドキュメントで、特に数字、日付、電話番号、ウェブサイトのアドレスについて、手書きの文字起こしの精度が向上します。Textract は、小切手、医療フォーム、旅行フォームなどのドキュメント内の手書きの文字をより正確に検出するようになりました。 

このアップデートは、7 月 8 日にアジアパシフィック (シンガポール) で提供が開始され、その後、7 月 9 日に米国西部 (北カリフォルニア)、欧州 (アイルランド)、アジアパシフィック (シドニー)、米国東部 (オハイオ)、7 月 12 日に欧州 (フランクフルト)、GovCloud (米国西部)、GovCloud (米国東部)、米国東部 (バージニア北部)、欧州 (ロンドン)、7 月 13 日に欧州 (パリ)、アジアパシフィック (ソウル)、カナダ (中部)、アジアパシフィック (ムンバイ)、米国西部 (オレゴン) で順次提供が開始されます。