投稿日: Sep 24, 2020

Amazon Textract は、スキャンされたドキュメントや画像内のテーブルやフォームなどから、テキストやデータを自動的に抽出できる機械学習サービスです。フルマネージド型のサービスである Textract が長期にわたり継続的な改善を提供します。本日、光学式文字認識(OCR)機能とフォーム認識機能の品質を強化した点について発表できることを嬉しく思います。新しい OCR モデルでは、以前よりも正確に度記号(°)や中国人民元(CNY ¥)、日本円(JPY ¥)、インドルピー(₹)、英国ポンド(£)、米ドル (USD)($)などの通貨記号を検出します。。

最新のフォームモデルは、より高い精度を備え、さまざまなフォーム、特に給与明細書、銀行取引明細書、税務書類などの「収入証明書」で利用できます。改善された Amazon Textract を活用すれば、金額、温度の読み取り、チェックボックスの有無、またはフォーム要素を含むドキュメントのキーと値のペアなどのコンテキスト情報をより正確に検出できるようになります。

OCR 機能は、アジアパシフィック(シンガポール)リージョンではすでに更新されており、Amazon Textract が利用可能な他のすべての AWS リージョン でも数日中にリリースされる予定です。最新のフォームモデルは、本日 Amazon Textract が利用可能なすべての AWS リージョンでリリースされました。  

今すぐ Amazon Textract をお試しください。