投稿日: Feb 17, 2020
Amazon Rekognition は、安全でないコンテンツを検出して、物体、人間、テキスト、シーンの特定やコンテンツモデレーションを行うことができる、ディープラーニングベースの画像および動画分析サービスです。本日から、動画内のテキストを検出し、検出の信頼性、位置の境界ボックス、各テキスト検出のタイムスタンプを取得できます。さらに、画像と動画の両方でのテキスト検出により、関心リージョン (ROI)、単語境界ボックスサイズ、および単語信頼スコアによって単語を除外する便利なオプションが提供されるようになりました。
動画のテキスト検出は、特にメディアおよびエンターテインメントアプリケーションで、複数のユースケースに活用できます。最初に、「ニュース速報」など、特定のキーワードが画面に表示されている動画または動画のタイムスタンプを検索できます。次に、コンテンツを国際化するために、プログラム動画タイムライン上のテキストのすべてのインスタンスをすばやく検索して、別の言語のテキストに置き換えることができます。また、コンプライアンスと節度のユースケースでは、ブラックリストに載っている単語やフレーズの辞書に対して単語をチェックすることで、字幕の欠陥と、冒涜や憎悪の言葉を含むテキストのフラグ付けなどの偶発的なテキストを検出できます。最後に、境界ボックスの場所を使用して、テキストサイズと場所がマーケティングキャンペーンのパフォーマンスに与える影響を調査したり、他のグラフィック要素を正しく配置したりできます。
テキスト領域、サイズ、および信頼スコアのフィルタリングにより、テキスト検出出力を制御するための柔軟性がさらに提供されます。ROI を使用することで、テキスト検出を自分の関連領域に簡単に制限できます。たとえば、画面上のグラフィックスの下部 3 分の 1 領域やサッカーゲームのスコアボードを読むための左上隅の領域などがあります。単語の境界ボックスサイズフィルターを使用すると、ノイズの多いテキストや無関係な小さな背景テキストを回避できます。最後に、単語信頼性フィルターを使用すると、ぼやけているか汚れているせいで信頼できない結果を削除できます。