Amazon Textract が DetectDocumentText API と AnalyzeDocument API の精度と機能の更新を発表
投稿日:
2025年6月30日
Amazon Textract は、あらゆるドキュメントまたは画像からテキスト、手書き文字、およびデータを自動的に抽出するマネージド型の機械学習サービスです。お客様のフィードバックをもとに、基盤となる機械学習モデルを定期的に改善することで、さらに高い精度を実現します。本日、Textract の DetectDocumentText API と AnalyzeDocument API で使用されるテキスト検出モデルの機能と精度が更新されたことをお知らせします。
今回の更新により、文書内の上付き文字、下付き文字、回転テキストのサポートが追加されました。このアップデートには、ボックス形式のテキスト検出、視覚的に類似した文字セット (例:「0」と「O」) の抽出、ファックスなどの低解像度のドキュメントでの精度改善が含まれます。
このアップデートは、米国東部 (オハイオ、バージニア北部)、米国西部 (北カリフォルニア、オレゴン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、パリ)、AWS GovCloud (米国東部、米国西部) の各リージョンで利用できます。
利用を開始するには、Amazon Textract コンソールにログオンしてください。Textract の機能の詳細については、Amazon Textract のウェブサイト、デベロッパーガイド、またはリソースページにアクセスしてください。