Amazon Web Services ブログ

AWS のメディア解析ソリューションを使用して、メタデータの自動抽出を使い始める



AWS でメディア解析ソリューションを使用して、メディアファイルから意味のあるメタデータを簡単に抽出することができます。

メディア解析ソリューションは、数分でメディアファイルから意味のあるメタデータの抽出を始めるために使用できる AWS CloudFormation テンプレートを提供します。ウェブベースのユーザーインターフェイスを使用すると、簡単にファイルをアップロードし、自動的に抽出されたメタデータを表示することができます。

このソリューションは、顔認識に Amazon Rekognition、文字起こしの作成に Amazon Transcribe、文字起こしでの感情分析に Amazon Comprehend を使用します。独自の画像を Amazon Rekognition コレクションにアップロードして、個人を認識できるようにソリューションをトレーニングすることもできます。

料金を支払うのは、このソリューションをテストするときに使用するサービスに対してのみです。1080p HD ビデオの場合、このソリューションを開始するのに必要なコストは、1 時間あたり 8 USD 以下です。このソリューションは、メディアライブラリにインデックス付けされるメタデータの量に基づいて、さまざまなサイズで利用できます。サイズに応じた価格の範囲は月額 300 – 1,000 USD で、主にメタデータのインデックス付け、検索、保存のための Amazon Elasticsearch Service のコンピューティングとストレージのコストで構成されています。

このブログ記事では、ソリューションを起動して画像やビデオをアップロードする方法を段階的に示します。メタデータがどのようにしてシームレスに抽出されるかを直接見ることができます。

注意: このソリューションは、現在は特定の AWS リージョンでのみ利用可能である Amazon Rekognition、Amazon Comprehend、Amazon Transcribe を使用しています。したがって、このソリューションは、これらのサービスが利用可能な AWS リージョンで起動する必要があります。最新のリージョン別の AWS のサービスの利用可用性については、リージョン別の AWS のサービス内容をご覧ください。

ステップ 1: メディア解析ソリューションのデプロイ

ユーザー名とパスワードを使って、AWS マネジメントコンソールにサインインします。メディア解析ソリューションへ移動して、[Deploy Solution] を選択します。

ステップ 2: AWS CloudFormation テンプレートの起動

ガイドドキュメントの「Launch the Stack」セクションにある [Launch Solution] を選択します。

ステップ 3: 「Select Template」ページで、[Next] を選択する

ステップ 4: 「Specify Details」ページで、E メールアドレスを入力して、[Next] を選択する

ステップ 5: 「Options」ページで、[Next] を選択する

ページの一番下にある了承事項を読み、「I acknowledge that AWS CloudFormation might create IAM resources with custom names」のボックスにチェックを入れて、[Create] を選択します。

スタックがデプロイされるまで、約 20 分待ちます。「CREATE_COMPLETE」と表示されると、メディア解析ソリューションのページにログインするための URL が記載された E メールが届きます。

ステップ 6: ユーザー名、仮パスワードを取得して、URL にサインインする

「CREATE_COMPLETE」と表示されると、次のような E メールが届くはずです。仮パスワードでサインインした後、新しいパスワードを作成するように求められます (少なくとも 1 つ大文字を含める必要があります)。

ステップ 7: ユーザー名と一時パスワードでサインインして、開始する

サインインした後、右上隅にある [Upload] をクリックします。

ステップ 8: Amazon Rekognition コレクションに追加する

メディアを解析するだけでなく、このソリューションを使用すると、Amazon Rekognition コレクションに顔をアップロードして、アップロードされたメディアで顔が自動的に認識されるようにすることができます。このチュートリアルでは、Matt Wood の画像をアップロードします (ダウロードするには、ここをクリックしてください)。

[Choose File ] を選択 (または Mac では [Browse] を選択) して、ダウンロードしたばかりの画像を選択します。

次に、画像に「mattwood」と名前を付けて、[Upload Face] を選択します。

ステップ 9: 新しいメディアをアップロードする

ここで、解析するビデオファイルをアップロードして、このソリューションが Amazon Rekognition、Amazon Transcribe、Amazon Comprehend の機能をどのように自動的に使用するかを示します。デモ用のコンソールでは最大 100 MB のファイルをアップロードできますが、このチュートリアルでは re:Invent 2017での Matt Wood の映像をアップロードします (ダウロードするには、ここをクリックしてください)。

[Select Choose File] を選択 (または Mac では [Browse] を選択) して、ダウンロードしたばかりのビデオを選択します。

[Upload Media] を選択します。

100 MB を超えるファイルをアップロードする場合は、AWS CloudFormation テンプレートの一部として作成されたメディア解析 Amazon S3 バケットで直接行う必要があります。この 100 MB の制限は、デモ用コンソールを使用する場合にのみ発生します。

アップロードが完了すると、ビデオの解析が自動的に開始されます。アップロードに必要な時間は、インターネット接続によって異なります。[View progress in your AWS Console] を選択して進捗を確認するか、進捗バーが緑色になるのを待って、[View Results] を選択します。

[View progress in your AWS Console] を選択した場合、「Execution details」の下でソリューションがまだ実行中であるか確認できます。また、「Visual workflow」の下でステップ機能を確認することもできます。メディア解析ソリューションのページに戻るには、ブラウザの [戻る] ボタンを使用し、メディア解析ソリューションのページで [Browse] を選択します。

[View Results] を選択します。

ご覧のように、抽出されたメタデータには、Amazon Rekognition のラベル、顔の属性、既知の顔、有名人、 Amazon Transcribe の文字起こし、Amazon Comprehend のエンティティとフレーズなどが含まれます。

[Known Faces] を選択すると、このビデオを解析する前に Amazon Rekognition コレクションに追加していたので、Matt Wood が認識されていることが分かります。この機能は、複数の個人の識別を必要とする一般的なメディアのユースケースで非常に便利です。

また、[Entities] を選択すると、Amazon Comprehend が Matt のプレゼンテーションから Rick Astley や Eric Clapton などのアーティストを認識したことも分かります。

ステップ 10: リソースの停止

AWS マネジメントコンソールを開いて、検索バーに「CloudFormation」と入力して、それを選択します。

「MediaAnalysis」を含んでいるスタック名のチェックボックスを選択し、[Actions] ドロップダウンリストを選択して、[Delete Stack] を選択します。別のウィンドウが表示されるので、[Yes, Delete] を選択します。 このチュートリアルの一部であったすべてのリソースを終了するために、必ず「MediaAnalysis」を含んでいるそれぞれのスタック名に対してこの操作を行うようにしてください。

次に、AWS マネジメントコンソールを開いて、検索バーに「S3」と入力して、それを選択します。このソリューションを起動して作成した S3 バケットを見つけて削除します。まず、削除する S3 バケットをクリックし、[Delete bucket] を選択し、バケットの名前を入力してから、[Confirm] を選択します。ソリューションの起動およびテスト画像とビデオのアップロードから作成された新しい S3 バケットのそれぞれについてこれを行います。

まとめ

これでメディアファイルからメタデータを抽出することが簡単であることが分かったので、このソリューションを使用して、検索可能なメディアライブラリを迅速に構築したり、ビデオフッテージにインデックス付けしたり文字起こししたりすることができるようになります。

詳細:

 


今回のブログ投稿者について

Kaiser Larsen は、AWS 人工知能ソリューションのプロダクトマーケティングマネージャです。仕事以外では、彼はハイキング、家族や友人のための料理が趣味であり、お祝いがあるときはいつでもアイスクリームを食べています。