投稿日: Nov 17, 2021

Amazon Rekognition は、画像内のテキストを検出して読み取り、見つかった各単語のバウンディングボックスを返せるます。本日より、Amazon Rekognition は画像内のテキスト検出を新たに 7 言語でサポートします。新たな言語は、アラビア語、ロシア語、ドイツ語、フランス語、イタリア語、ポルトガル語、スペイン語です。Amazon Rekognition は、画像内の全てのサポート言語のテキストを自動で検出し抽出します。言語パラメータは必要ありません。また、Amazon Rekognition は全体的にも、画像内の仮想テキストと歪曲したテキストに関しても精度が向上しています。

お客様は、複数のユースケースのイメージでテキスト検出をご使用いただけます。第一に、テキスト検出はコンテンツのモデレーションのワークフローをサポートします。検出されたテキストは、不適切または望ましくない語句のリストと照合できます。第二に、お客様は、検出されたテキストの境界ボックスエリアを使用して、個人を特定できる情報 (PII) をリダイレクトできます。第三に、テキスト検出を使用して特定の言葉、テキスト配列、テキストサイズがマーケティングキャンペーンのパフォーマンスにいかに影響を与えるかを理解することができます。第四に、お客様はテキスト検出を使用して Digital Asset Management (DAM) 内の特定のキーワードやキャプションで画像や動画のアセットを簡単に検索することができます。また、テキスト検出は道路や通りの看板や公安、公共交通手段のテキストを読み取るマッピングアプリケーションおよびオートモーティブアプリケーションをサポートしています。以下は、OLX Global 社が Amazon Rekognition を画像内のテキスト検出にどのように使用しているかについての引用です。

分類された市場セクターのリーダーとして、安全で包括的で活気のある売買コミュニティを育成するため、プラットフォームにリストされているすべての製品が製品の表示と信頼性に関する規則に準拠していることを確認することが最も重要です。そのために、広告のその他側面の中でも、ユーザーがアップロードした画像上の非有機的なテキストの分析に重点を置いています。このため、Amazon Rekognition のテキスト検出機能をテストしたところ、非常に正確であり、社内の違反検出システムを強化し、モデレーションワークフローの改善に役立っていることがわかりました。テキスト検出に Amazon Rekognition を使用して、昨年、350,000 件のポリシー違反に対しフラグを立てられました。また、開発コストを大幅に削減し、データサイエンスの時間を他のプロジェクトに集中させるのに役立ちました。テキスト分析の機能がさらに拡張されるため、今後のテキストモデルの更新に非常に期待しています。」- OLX グループ、データサイエンスマネージャー、Jaroslaw Szymczak 

Amazon Rekognition でサポートされるすべての AWS リージョンで、これらの機能向上が利用可能になりました。Rekognition コンソールにアクセスするか、最新の AWS SDK をダウンロードして、アプリケーションの構築を開始しましょう。Amazon Rekognition を使用したテキスト検出の詳細については、ドキュメントを参照してください。