投稿日: Nov 16, 2020

機械学習サービスである Amazon Textract は、ドキュメント、テーブル、およびフォームからテキストやその他のデータを抽出します。本日は、2 つの新機能を発表します。

  • Amazon Textract は、ヘルスケア関連書類、処方箋、異議申立書、税務書類、収入書類、小切手、訴状、学術論文などの書類からの手書き文字の認識をサポートするようになりました。Detect Document Text または Analyze Document API を使用して、スキャンしたドキュメントの画像または PDF を処理し、印刷されたテキストと手書きの文字の両方を抽出して、スキャンしたドキュメントのほとんどすべての処理を簡単に自動化できます。また、別の AWS のサービスである Amazon Augmented AI (Amazon A2I) を使用することもできます。これにより、機械学習の予測についての人間による確認のためのワークフローを簡単に構築できます。Amazon Textract コンソールにログインして、手書きの文字の機能をテストしたり、Amazon Machine Learning Hero Mike Chambers による新しいデモをチェックしたりできます。 
  • Amazon Textract は、スペイン語、ドイツ語、イタリア語、ポルトガル語、およびフランス語で印刷されたテキストを含むドキュメントの処理のサポートを開始しました。テキスト抽出のためにこれらの言語でドキュメントの送信を開始できます。Amazon Textract が自動的に情報を検出して抽出します。

また、Amazon Textract が AWS 欧州 (パリ) リージョンで利用可能になったことをお知らせします。使用を開始するには、Amazon Textract コンソールにログインして、手書きの文書と新しい言語のサポートをテストします。Textract の機能の詳細については、Amazon Textract のウェブサイトデベロッパーガイド、またはリソースページにアクセスしてください。