投稿日: Sep 23, 2022

Amazon Textract は、あらゆるドキュメントまたは画像からテキスト、手書き文字、およびデータを自動的に抽出する機械学習サービスです。お客様のフィードバックをもとに、基盤となる機械学習モデルを継続的に改善することで、さらに高い精度を実現します。本日、DetectDocumentText API 経由で利用できるテキスト抽出機能の品質を強化したことを発表いたします。

DetectDocumentText API 経由で利用できる最新のテキスト検出モデルでは、単語と行の抽出精度が向上しています。特に、小切手に一般的に見られる E13B フォント、銀行書類に見られる国際銀行口座番号、長い単語 (E メールアドレスなど) に関する抽出精度が向上しています。

最後に、基礎となる機械学習モデルを機能強化し、DetectDocumentText API を呼び出す際のレイテンシが短縮されたことを発表いたします。

この更新は、米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国) リージョンで 9 月 20 日から利用可能になります。

使用を開始するには、Amazon Textract コンソールにログオンして新機能をお試しください。Textract の機能の詳細については、Amazon Textract のウェブサイトデベロッパーガイド、またはリソースページにアクセスしてください。