はじめに

Amazon Rekognition Video は、Amazon S3 に保存されているビデオから、物体、シーン、有名人、テキスト、動作、および不適切なコンテンツを検出する、機械学習を利用したビデオ分析サービスです。また、Rekognition Video は精度の高い顔分析および顔検索機能も備えており、顔の検出、分析、比較が行えるほか、ビデオ内での人物の動きを追跡することもできます。
各検索結果や検出にはタイムスタンプが付いているため、詳細なビデオ検索向けのインデックスをすぐに作成できるほか、さらなる分析のために興味のある箇所にすばやく移動することもできます。対象が物体、顔、テキスト、人物の場合、Rekognition Video は境界ボックスの座標を返します。これはフレーム内の具体的な検出場所を示すものです。

Amazon Rekognition Video は、お客様から提供された顔データをもとに、Amazon Kinesis Video Streams で作成したライブストリームをモニタリングして顔の検出や検索を行うこともできます。また、Amazon Rekognition Video とあわせて Amazon Transcribe を使用すれば、クローズドキャプション、プロファニティフィルタ、ストリーミングビデオトランスクリプションといった音声分析をアプリケーションに組み込むことができます。

ユースケース

メディア資産の検索とインデックス化

Amazon Rekognition Video が生成する、物体、シーン、アクティビティ、有名人、テキスト、および顔分析のメタデータを使用すれば、大規模なビデオアーカイブを自動的にインデックス化し、簡単に検索できるようにすることが可能です。担当者は、すべてのビデオを手作業で探すのではなく、必要な資産をすばやく発見できるようになります。Amazon Rekognition Video や Amazon Transcribe、そしてMedia2Cloud や Media Insights Engine といったエンドツーエンドのサーバーレスな AWS ソリューションを使えば、ビデオテープからメディア資産管理 (MAM) システムに至るまでのプロセスを横断して、アーカイブをシームレスに収集整理、選別、および収益化することができます。

コンプライアンスと品質管理

Amazon Rekognition Video を使うと、何千時間分ものメディア資産の中に不適切なコンテンツやブランドを脅かすコンテンツがある場合に、すばやくフラグを立てることができます。モデレーターは、Amazon Rekognition Video がフラグを立てたタイムスタンプのみをチェックすればよく、すべての資産を秒刻みで確認する必要はありません。また、階層的な、詳細なモデレーションラベルを使用できるので、さまざまな国際市場におけるコンプライアンスのニーズにも対応できます。音声モデレーションを実行するときは、Amazon Transcribe のメタデータを使用します。

コンテンツ連動型広告

Amazon Rekognition Video では、表示されているビデオコンテンツに最も関連する広告を表示することが可能です。特定のタイムスタンプで検出されたラベル、動作、あるいは有名人を使用すれば、コンテンツの直後に表示される広告の効果とリターンを押し上げることができます。

小売業の分析

Amazon Rekognition Video では、買い物客がたどる経路を調べることで、小売店でのそれぞれの買い物客の行動と密度を分析できます。顔分析を使用すれば、買い物客を特定せずに、平均年齢層、性別分布、人々が表す感情を理解することもできます。

公共安全の課題に迅速に対応

Amazon Rekognition Video を使うと、保存されているビデオまたはストリーミングビデオから人物を発見できるアプリケーションを作成できます。ユーザーから提供された行方不明者のデータベースを検索することにより、可能性のある一致に正確にフラグを立て、捜索活動をスピードアップすることができます。

主な特徴

物体、シーン、アクティビティ検出

Amazon Rekognition Video では、車両やペットといった物体、都市やビーチ、結婚式といったシーン、小包の配達やダンスといった動作など、何千もの対象を自動的に認識できます。検出したラベルごとに信頼スコアを取得します。「人物」や「車」などの一般的な物体の場合、物体の境界ボックスを使用すれば集計や位置特定も可能です。また、Amazon Rekognition Video は「ろうそくを吹く」や「火を消す」などビデオ内の動作の中から複雑な動きを正確に識別できます。こうした豊富なメタデータを使用することで、コンテンツを検索可能にしたり、それ以前のコンテンツの文脈に見合った広告を表示したりすることができます。

詳細はこちら »

コンテンツのモデレーション

Amazon Rekognition Video は、ヌード、暴力、武器などビデオ内の不適切なコンテンツを自動検出し、各検出のタイムスタンプを表示します。また、信頼スコアが付いたラベルの階層リストを取得できます。これには、安全でないコンテンツの下位カテゴリが記されています。たとえば「Graphic Female Nudity (女性のヌード画像)」は、「Explicit Nudity (明示的なヌード)」の下位カテゴリになります。信頼スコアと詳細なラベルを使えば、さまざまな企業ルールをセットアップして、異なる市場や地域のコンプライアンスニーズに対応することができます。

詳細はこちら »

テキスト検出

Amazon Rekognition Video は、ビデオ内のテキストを自動的に検出して読み上げるほか、検出の信頼性、位置の境界ボックスのほか、各テキスト検出のタイムスタンプを取得できます。さらに、関心領域 (ROI)、単語境界ボックスサイズ、単語信頼スコアで単語を選別できる便利なオプションも追加されています。たとえば、画面上のグラフィックの下 3 分の 1 に表示されているテキストのみを検出する、あるいはサッカーの試合の得点表を読みとるため画面左上のみを検出する、といったことが可能です。

詳細はこちら »

有名人の認識

Amazon Rekognition Video を使用すると、よく知られた人物がいつどこでビデオに登場するのかを検出し認識することができます。タイムコード付きの出力には、有名人の名前と一意の ID、有名人の関連コンテンツを指す URL (例: 有名人の IMDB リンク) が含まれます。

詳細 »

顔検出と分析

Amazon Rekognition Video では、ビデオフレーム内で最大 100 人の顔を検出し、境界ボックスの位置を返すことが可能です。さらに、検索された顔ごとに、性別、感情、推定の年齢層、笑顔かどうか、といった追加の属性を各検出のタイムスタンプと併せて得ることができます。

詳細はこちら »

顔検索

Amazon Rekognition Video は、顔画像のプライベートなリポジトリに照らして検索することで、ビデオ内の既知の人物を特定することができます。各一致に対して類似性スコアを、同じ人物がビデオ内で特定された場合はそれぞれの時点のタイムスタンプが得られます。また、Amazon Rekognition Video はリポジトリのいずれの顔にも一致しないビデオ内の未知の人物をすべてクラスター化し、それぞれに一意の識別子をつけてタイムスタンプを返します。

詳細 »

人物の動線の検出

Amazon Rekognition Video では、各人物がビデオ内のどこを、いつ、どのように移動したかを追跡できます。また、特定された各人物に一意のインデックスをつけることができ、ビデオ内の人数を集計することができます。

詳細 »

ライブストリーミングビデオ分析

Amazon Rekognition Video では、お客様のライブビデオストリーミングをリアルタイムで解析して、顔を検出および検索できます。Amazon Kinesis Video Streams からのストリーミングを Amazon Rekognition Video に入力として与えると、イメージのリポジトリと照らし合わせて、非常に低いレイテンシーで顔検索を実行できます。

詳細 »

お客様

CBS

マスメディア企業 CBS は、業界最先端のコンテンツをさまざまなプラットフォームにわたってグローバルに制作、配信しています。CBS は視聴率が国内トップのテレビネットワークを米国内に持ち、そのエンターテインメントコンテンツのライブラリは世界最大級で、そのブランド「Eye」はビジネス界の認知度では最高クラスです。

「CBS では、不適切なコンテンツで世界の視聴者に不快感を与えたり、各国の法令に違反したりしないように、プログラミングによるモデレーションに注力しています。ほぼリアルタイムの審査を実施し、毎月数百時間にのぼるコンテンツを編集しているのは、手作業に労力を注ぐことによります。社内プロセスをスケールするために、Amazon Rekognition を使用してビデオコンテンツのモデレーションを自動化すると同時に、カスタムラベルの新機能でモデレーションモデルを改良する道を探りました。このおかげで、裸体、卑猥なジェスチャー、暴力などのセンシティブなコンテンツのタグ付けを自動化して、処理時間を数時間単位から数分単位に短縮しました」

Jamie Duemo 氏、CBS Operations および Engineering、マルチプラットフォーム配信担当上級副社長

VidMob

VidMob は、マーケターとエディター、アニメーター、およびモーショングラフィックデザイナーの専門家をグローバルに結びつけるテクノロジープラットフォームです。

「パフォーマンスデータを得ることは簡単です。でも、あるクリエイティブアセットが他と比べて良い成績を上げるのはなぜかを理解すること、そしてその情報に基づいて行動する能力を持つことは簡単ではありません。当社では、Amazon Rekognition をベースに VidMob の Agile Creative Suite™ を構築することで、マーケティング担当者が最も苦労する 2 つの点に取り組みました。これまでに、Agile Creative Suite では Rekognition を使って 40,000 個以上のクリエイティブアセットが分析されました。Rekognition からの詳細なデータによって、クライアントに驚くべきインサイトを提供し、コンテンツをまったく新しい観点から見ることができるようにサポートしています。」

Alex Collmer 氏、VidMob、創設者兼 CEO

Pattern89 は、世界初の有料ソーシャルネットワーク向けデータサイエンスコーチングプラットフォームです。

「Pattern89 では Amazon Rekognition を使用して、Facebook や Instagram での広告パフォーマンスを改善するクリエイティブコーチングといった、奥行きの深いデータ分析をお客様に提供しています。お客様は当社からの推奨事項を実践することで、広告支出を削減し、収益を増加させ、効率性のメトリクスを改善しました。当社が Amazon Rekognition を選択した決め手は、シンプルな API、複数のメディアタイプのサポート、そしてクラス最高のラベリングと顔検出です。」

Matt Brown 氏、CTO - Pattern89

Amazon Rekognition 料金の詳細

料金ページを見る
構築を始めましょう。
Amazon Rekognition Video の使用を開始する
ご不明な点がおありですか?
お問い合わせ