全般

Q: Amazon Rekognition とは何ですか?

Amazon Rekognition は、強力な画像分析をアプリケーションに簡単に追加できるようにするサービスです。Rekognition Image を使用すると、数百万の画像を検索、検証、整理するための強力なアプリケーションを簡単に構築できます。Rekognition Video を使用すると、保存された動画やライブストリーム動画からモーションベースのコンテキストを抽出し、分析できます。

Rekognition Image は、オブジェクト、シーン、顔の検出や、テキストの抽出、有名人の認識、画像内の不適切なコンテンツの識別ができる画像認識サービスです。また、顔を検索して比較することもできます。Rekognition Image は、Amazon のコンピュータ視覚科学者が日々何十億もの画像を分析する Prime Photos のために開発したものと同じ、実証済みで高度にスケーラブルな深層学習テクノロジーを使ったサービスです。

Rekognition Image は、深層ニューラルネットワークモデルを使用して、画像に写っている幾千もの物や状況を検出し、ラベル付けします。今後も継続的に新たなラベルや顔認識機能が追加されていく予定です。Rekognition Image では、分析する画像と保存する顔のメタデータに対してのみ支払いが発生します。

Rekognition Video はビデオ認識サービスであり、人を追跡し、アクティビティを検出します。また、Amazon S3 に保存されているビデオや、Acuity のライブビデオストリームで、オブジェクト、有名人、不適切なコンテンツを認識します。Rekognition Video は、人物を検出し、顔が見えなくても、または人物の全身がシーンから出たり入ったりしていても、ビデオを介して人物を検出し追跡します。これにより、容疑者のような個人の調査とリアルタイム監視が簡単かつ正確になります。例えば、誰かがあなたのドアに荷物を配達したときにリアルタイム通知を送信するアプリケーションでこれを使用することができます。Rekognition Video では、オブジェクト、アクティビティ、シーン、有名人、顔などのメタデータのインデックスを作成し、ビデオ検索を容易にすることもできます。

Q: 深層学習とは何ですか?

深層学習は機械学習の一分野です。また、人工知能の重要な分野でもあります。複数の線形変換および非線形変換で構成される複数の処理レイヤーがある深層グラフを使用して、生のデータから高度な抽象化を行うことが目的です。深層学習は、おおまかにいうと脳内の情報処理と通信のモデルに基づいています。深層学習では、人間が作成した特徴を、非常に大量の注釈付きデータから学習した特徴に置き換えます。深層グラフ内の数十万のパラメータを効果的なアルゴリズムで反復的に計算することで学習を行います。

深層畳み込みニューラルネットワーク (CNN) やリカレントニューラルネットワークなどのいくつかの深層学習アーキテクチャが、コンピュータビジョン、音声認識、自然言語処理、およびオーディオ認識に適用され、さまざまなタスクで最先端の成果が実現しています。

Amazon Rekognition は、Amazon AI の一連のサービスの一部です。Amazon AI の各サービスは深層学習を利用して、画像の認識、テキストからリアルな音声への変換、直感的な会話型テキストおよび音声インターフェイスの作成を行います。

Q: Amazon Rekognition を使用するには深層学習の専門知識が必要ですか?

いいえ。Amazon Rekognition では、深層学習のパイプラインを構築、保守、アップグレードする必要はありません。

コンピュータビジョンの複雑なタスク (物体とシーンの検出、顔分析、顔認識など) で正確な結果を出すために、深層学習システムは、適切にチューニングを行い、膨大な量のラベル付きの正解データでトレーニングを行う必要があります。データを正しく調達、整理、ラベル付けするには時間とコストがかかります。さらに、深層ニューラルネットワークのトレーニングは計算コストが高く、多くの場合、グラフィック処理ユニット (GPU) を使用して構築されたカスタムハードウェアが必要になります。

Amazon Rekognition はフルマネージド型で、画像およびビデオ認識タスクが事前にトレーニング済みであるため、深層学習のパイプライン作成に時間とリソースを投資する必要はありません。Amazon Rekognition では、最新の研究に基づいて構築し、新しいトレーニングデータを調達することで、モデルの正確性を継続的に向上させます。これにより、お客様は価値の高いアプリケーションの設計と開発に集中できます。

Q: Amazon Rekognition の最も一般的なユースケースは何ですか?

Rekognition Image の最も一般的な使用例は次のとおりです。

  • 検索可能な画像ライブラリ
  • 顔ベースのユーザー認証
  • 感情分析
  • 顔認識
  • 画像の節度
  • ナンバープレートの認識

Rekognition Video の最も一般的な使用例は次のとおりです。

  • 公共の安全とセキュリティのための迅速な対応
  • 公共安全のための事象の調査分析
  • ビデオアーカイブの検索インデックス
  • 明示的や暗示的なコンテンツに対するビデオの簡単なフィルタリング

Q: Amazon Rekognition を開始するにはどうすればよいですか?

Amazon Rekognition にまだサインアップしていない場合は、Amazon Rekognition ページの [AMAZON REKOGNITION をお試しください] をクリックし、サインアッププロセスを完了してください。これにはアマゾン ウェブ サービスのアカウントが必要です。まだお持ちでない場合は、サインアッププロセス中に画面の指示に従って作成してください。サインアップしたら、Amazon Rekognition マネジメントコンソールを使用して自分の画像やビデオで Amazon Rekognition を試してみるか、Amazon Rekognition SDK をダウンロードして独自のアプリケーションの作成を開始してください。詳細については、入門ガイドの手順を参照してください。

Q: Amazon Rekognition ではどのような API が提供されていますか?

Amazon Rekognition Image の API では、物体とシーンの検出、顔の検出と分析、有名人の認識、不適切なコンテンツの検出、顔コレクションでの似ている顔の検索が可能です。API でリソースを管理することもできます。Rekognition Image は、顔の比較とテキストの抽出ができる API も提供し、Rekognition Video は人を追跡し、Acuity のライブストリームビデオを管理するための API も提供しています。詳細については、Amazon Rekognition の API リファレンスを参照してください。

Q: Amazon Rekognition でサポートされている画像およびビデオの形式は何ですか?

Amazon Rekognition Image では現在 JPEG と PNG の画像形式がサポートされています。S3 オブジェクトまたはバイト配列として画像を送信できます。Amazon Rekognition Video の操作で、Amazon S3 バケットに保存されている動画を分析できます。ビデオは、H.264 コーデックを使用してエンコードする必要があります。サポートされているファイル形式は MPEG-4 と MOV です。コーデックとは、データを圧縮してより高速に配信し、受信したデータを元の形式に復元するソフトウェアまたはハードウェアです。H.264 コーデックは、ビデオコンテンツの録画、圧縮、および配信によく使用されます。ビデオファイル形式には、1 つ以上のコーデックが含まれている場合があります。MOV または MPEG-4 形式のビデオファイルが Rekognition Video で動作しない場合は、ビデオをエンコードするために使用されたコーデックが H.264 であることを確認してください。

Q: Amazon Rekognition で使用できるファイルのサイズはどのくらいですか?

Amazon Rekognition Image では、S3 オブジェクトとして送信する場合は最大 15 MB、画像のバイト配列として送信する場合は最大 5 MB の画像ファイルがサポートされます。Amazon Rekognition Video は、S3 ファイルとして渡されると、最大 8 GB のファイルと最大 2 時間のビデオをサポートします。

Q: 画像の解像度は Rekognition Image API 結果の品質にどのような影響を与えますか?

Amazon Rekognition はさまざまな画像解像度に対応しています。最適な結果を得るために、VGA (640x480) 以上の解像度を使用することを推奨します。Amazon Rekognition は両ディメンションが 80 ピクセル以上の画像に対応していますが、QVGA (320x240) より解像度が低い場合は顔や物体、不適切なコンテンツを認識しない可能性が高くなります。

Q: Amazon Rekognition Image で検出および分析できる物体の最小サイズはいくらですか?

通常は、画像内に表示されている最小の物体または顔が、画像の短いディメンションのサイズ (ピクセル) の 5% 以上になるようにしてください。例えば、1600x900 の画像の場合、最小の顔または物体は、両方のディメンションで最低 45 ピクセル必要です。

Q: ビデオ解像度は、Rekognition Video API 結果の品質にどのように影響しますか?

このシステムは、(短い辺の寸法で) 32 ピクセルよりも大きい顔を認識するように訓練されています。つまり、認識する顔の最小サイズは、QVGA 解像度では画面の短い辺の約 1/7、HD 1080p 解像度では 1/30 などさまざまです。例えば、VGA 解像度の場合、画面の 1/ 10 より小さい顔では、パフォーマンスが低下すること想定されます。

Q: 他には Rekognition Video の API の品質に何が影響するのですか?

ビデオ解像度の他には、強いぼかし、速い動きの人物、照明条件、ポーズが API の品質に影響することがあります。

Q: Rekognition Video の API に適した推奨ユーザー動画コンテンツは何ですか?

この API は、通常の色と照明の条件で正面視野で撮影された消費者向けビデオやプロフェッショナル向けビデオに最適です。この API は、白黒、IR または極端な照明の状態でテストされていません。誤ったアラームに敏感なアプリケーションは、選択した (アプリケーション固有の) 信頼水準を下回る信頼水準の出力を破棄することをお勧めします。

Q: Amazon Rekognition はどの AWS リージョンで使用できますか?

Amazon Rekognition Image は現在、米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シドニー)、AWS GovCloud (米国) の各 AWS リージョンで利用可能です。Amazon Rekognition Video は、米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シドニー) の各リージョンでご利用いただけます。Amazon Rekognition Video のリアルタイムストリーミングは米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (アイルランド)、アジアパシフィック (東京) の各 AWS リージョンで利用可能です。

物体とシーンの検出

Q: ラベルとは何ですか?

ラベルは、コンテンツに基づいて画像内で検出された物体、シーン、または概念を表します。例えば、南国のビーチで複数の人が写っている写真の場合、「人」、「水」、「砂」、「ヤシの木」、「水着」 (物体)、「ビーチ」 (シーン)、「アウトドア」 (概念) などのラベルが含まれる場合があります。 

Q: 信頼スコアとは何ですか? どのように使用できますか?

信頼スコアは 0 から 100 までの数字で、特定の予測がどの程度正確であるかを示します。南国のビーチの例では、物体とシーンの検出プロセスが、「水」のラベルに信頼スコア 99、「ヤシの木」のラベルに 35 を返した場合、画像には水は含まれるもののヤシの木は含まれない可能性が高いということになります。

検出エラー (誤検出) の影響が大きいアプリケーションでは、信頼スコアが特定のしきい値を下回る結果を破棄する必要があります。最適なしきい値は、アプリケーションによって異なります。多くの場合、信頼スコアの最小値をデフォルト値より大きい値に設定することで、適切なユーザーエクスペリエンスを得ることができます。

Q: 物体とシーンの検出とは何ですか?

物体とシーンの検出は、画像またはビデオを分析して、視覚的な内容に基づいてラベルを割り当てるプロセスです。Amazon Rekognition Image では DetectLabels API でこのプロセスを実行します。この API では、数千の物体、シーン、および概念を自動的に特定して、各ラベルに対して信頼スコアを返します。DetectLabels では信頼スコアのデフォルトのしきい値は 50 です。物体とシーンの検出は、大規模な画像ライブラリを検索および整理したいお客様に最適です。ユーザーが生成したコンテンツに依存するコンシューマーアプリケーションやライフスタイルアプリケーション、ターゲティングのアルゴリズムを向上させたい広告会社などが含まれます。

Q: Amazon Rekognition でサポートされるラベルの種類にはどのようなものがありますか?

Rekognition では、一般的なカテゴリに属する数千のラベルがサポートされます。カテゴリには次のようなものがありますが、これらに限定されるものではありません。

  • 人とイベント: 「結婚式」、「花嫁」、「赤ちゃん」、「バースデーケーキ」、「ギタリスト」など。
  • 食べ物と飲み物: 「りんご」、「サンドイッチ」、「ワイン」、「ケーキ」、「ピザ」など。
  • 自然とアウトドア: 「ビーチ」、「山」、「湖」、「夕焼け」、「虹」など。
  • 動物とペット: 「犬」、「猫」、「馬」、「虎」、「亀」など。
  • 家と庭: 「ベッド」、「テーブル」、「裏庭」、「シャンデリア」、「寝室」など。
  • スポーツと娯楽: 「ゴルフ」、「バスケットボール」、「ホッケー」、「テニス」、「ハイキング」など。
  • 植物と花: 「バラ」、「チューリップ」、「ヤシの木」、「森」、「竹」など。
  • アートとエンターテインメント: 「彫刻」、「絵」、「ギター」、「バレエ」、「モザイク」など。
  • 交通機関と乗り物: 「飛行機」、「自動車」、「自転車」、「オートバイ」、「トラック」など。
  • 電化製品: 「コンピュータ」、「携帯電話」、「ビデオカメラ」、「テレビ」、「ヘッドフォン」など。

Q: 物体とシーンの検出は、ビデオ分析でどのように異なりますか?

Rekognition Video では、車やペットなどの何千ものオブジェクトや、お祝いやダンスなどのアクティビティを自動的に識別し、各ラベルのタイムスタンプと信頼スコアを提供します。また、「キャンドルを吹く」や「消火する」など、複雑なアクティビティを正確に識別するために、動画内の動きや時間の状況にも依存しています。

Q: 必要なラベルが見つかりません。新しいラベルをリクエストするにはどうすればよいですか?

AWS カスタマーサポートからリクエストをお送りください。Amazon Rekognition では、お客様からのフィードバックに基づいて継続的にラベルのカタログを拡大していきます。

安全でないコンテンツの検出

Q: 安全でないコンテンツの検出とは何ですか?

Amazon Rekognition の安全でないコンテンツの検出は、深層学習に基づいた、画像における明示的または暗示的なアダルトコンテンツを簡単に検出できる API です。開発者はこの追加メタデータを使用して、ビジネスニーズに応じて不適切なコンテンツをフィルタリングすることができます。アダルトコンテンツの存在に基づいて画像にフラグを設定する他に、画像の節度は信頼スコアとともにラベルの階層リストを返します。これらのラベルはアダルトコンテンツの特定のカテゴリを示し、これによって開発者は、大容量のユーザーが生成したコンテンツ (UGC) をより詳細に制御してフィルタリングおよび管理を行うことができます。この API は、ソーシャルサイトやデートサイト、写真共有プラットフォーム、ブログ、フォーラム、子供向けアプリ、e コマースサイト、エンターテインメントサービスおよびオンライン広告サービスなどのアプリケーションの節度のワークフローで使用できます。

Q: Amazon Rekognition では、どのような種類の明示的および暗示的アダルトコンテンツが検出されますか?

Amazon Rekognition は、画像における次の種類の明示的および暗示的アダルトコンテンツを検出します。

  • Explicit Nudity (明示的なヌード)
  • Nudity (ヌード)
  • Graphic Male Nudity (男性のヌード画像)
  • Graphic Female Nudity (女性のヌード画像)
  • Sexual Activity (性的な行為)
  • Partial Nudity (部分的なヌード)
  • Suggestive (暗示的)
  • Female Swimwear or Underwear (女性の水着または下着)
  • Male Swimwear or Underwear (男性の水着または下着)
  • Revealing Clothes (露出の多い衣服)

Amazon Rekognition の Unsafe Image Detection API は、ラベルの階層、および検出されたラベルごとの信頼スコアを返します。たとえば不適切な画像があったとして、Rekognition は最上位ラベルの信頼スコアで "Explicit Nudity" を返す可能性があります。開発者はこれを使用してコンテンツにフラグを設定できます。同じ応答において、"Graphic Male Nudity" などの追加コンテキストを独自の信頼スコアで提供することにより、Rekognition は 2 番目の細かさのレベルも返します。開発者は、この情報を使用してより複雑なフィルタリングロジックを構築できます。

Unsafe Image Detection API は、明示的および暗示的アダルトコンテンツに関する権威でも、それらの徹底的なフィルターであると主張するものでもないことに注意してください。また、Unsafe Image Detection API は、画像に違法なコンテンツ (児童ポルノなど) または不自然なアダルトコンテンツが含まれるかどうかを検出するものではありません。

Q: Amazon Rekognition の Unsafe Content Detection API は、明示的および暗示的アダルトコンテンツの他にも不適切なコンテンツを検出しますか?

現在、Rekognition では上述のラベルのみをサポートしています。お客様からのフィードバックに応じて、今後もラベルの追加および改善を行います。
他の種類の不適切なコンテンツが画像で検出される必要がある場合は、このセクションで後述するフィードバックプロセスをご使用の上、お問い合わせください。

Q: 安全でないコンテンツの検出は、ビデオ分析ではどう違うのですか?

Rekognition Video では、明示的または暗示的なアダルトコンテンツを自動的に識別し、各コンテンツタイプラベルのタイムスタンプと信頼スコアを提供します。

Q: Rekognition が自分のアダルト画像とビデオの検出ユースケースを満たしているかをどう確認すればよいですか?

Rekognition の安全でないコンテンツの検出モデルは調整され、広範囲にわたってテストされていますが、ご自身のデータセットで精度を測定し、パフォーマンスを評価することをお勧めします。

API リクエストで ‘MinConfidence’ パラメータを使用して、コンテンツの検出 (再現率) と検出の精度 (適合率) が釣り合うようにすることができます。‘MinConfidence’ の値を減らすと、不適切なコンテンツのほとんどが検出されますが、明示的または暗示的でないコンテンツも検出されることがあります。‘MinConfidence’ の値を増やすと、検出されるコンテンツはすべて実際に明示的または暗示的ですが、一部の不適切な画像がタグ付けされない可能性があります。画像への ‘MinConfidence’ の使い方の例については、このドキュメントをご覧ください。

Rekogntion が画像またはビデオのアダルトコンテンツの検出に失敗した場合は、後述のフィードバックプロセスをご使用の上、お問い合わせください。

Q: 安全でないコンテンツの検出を改善するために Rekognition に関するフィードバックを行うには、どうすればよいですか?

AWS カスタマーサポートからリクエストをお送りください。Amazon Rekognition では、お客様からのフィードバックに基づいて継続的に、検出される不適切なコンテンツの種類を拡大していきます。新しい種類の明示的または暗示的アダルトコンテンツの追加には、通常 6~8 週間ほどかかります。違法なコンテンツ (児童ポルノなど) は、このプロセスからは受け付けられないことに注意してください。

顔分析

Q: 顔分析とは何ですか?

顔分析は、画像内にある顔を検出し、関連する顔属性を抽出するプロセスです。Amazon Rekognition Image は、性別、サングラスの有無、顔の特徴などの属性と共に、画像内で検出された各顔の境界ボックスを返します。Rekognition Video は、タイムスタンプ付きのビデオで検出された顔と、検出された顔ごとに、顔の特徴とともに位置と境界ボックスを返します。

Q: Amazon Rekognition で取得できる顔属性は何ですか?

Amazon Rekognition では、検出された顔ごとに次の顔属性が返されます。また、境界ボックスと各属性の信頼スコアも取得します。

  • 性別
  • 笑顔
  • 感情
  • 眼鏡
  • サングラス
  • 目を開いているか
  • 口を開いているか
  • 口ひげ
  • あごひげ
  • 姿勢
  • 顔の特徴

Q: 顔ポーズとは何ですか?

顔ポーズは、ピッチ軸、ロール軸、ヨー軸における、検出された顔の回転を表します。これらのパラメータはそれぞれ -180 度から +180 度の間の角度として返されます。顔ポーズを使用すると、顔の境界ポリゴン (長方形の境界ボックスとは対照的) の方向性を検出し、変形の測定や、顔の正確なトラッキングなどを実行できます。

Q: 顔の質とは何ですか?

顔の質は、鮮明度と明るさを示す 2 つのパラメータを使用して、検出された顔の画像の質を表します。パラメータは両方とも 0 から 1 の間の値として返されます。これらのパラメータにしきい値を適用して、顔の明るさと鮮明度でフィルタリングできます。これは、顔の比較や顔認識など、高画質の顔画像を利用するアプリケーションで便利です。

Q: 顔の特徴とは何ですか?

顔の特徴は、いくつかの特徴となるポイントを集めたもので、通常は、目、鼻、口など顔の主要な構成要素のふち、先端、中心の位置を表します。Amazon Rekognition の DetectFaces API は、顔のクロップ、ある顔から別の顔へのモーフィング、カスタムフィルターを作成するオーバーレイカスタムマスクなどに使用できる、一連の顔の特徴を返します。

Q: 1 つの画像からいくつ顔を検出できますか?

Amazon Rekognition を使用して 1 つの画像から最大 100 個の顔を検出できます。

Q: ビデオ分析では、顔分析はどのように違いますか?

Rekognition Video を使えば、ビデオ内の顔の位置を特定し、笑っているか、目が開いているか、感情を表しているかといった顔属性を分析できます。Rekognition Video は、検出された顔をタイムスタンプとともに、検出された各顔について、左目、右目、鼻、口の左隅、および口の右隅などの特徴とともに位置および境界ボックスを返します。この位置および時間情報は、時間の経過とともにユーザーの感情を容易に追跡し、自動顔フレーム、ハイライトまたはクロップなどの追加機能を提供するために使用できます。

Q: ビデオ解像度に加えて、Rekognition Video の API の品質には他に何が影響するのですか?

ビデオの解像度に加えて、検索する顔コレクションの要素である品質と代表顔は大きな影響を与えます。ひげ、眼鏡、ポーズ (側面と正面) のようなバリエーションで、人物ごとに複数の顔のインスタンスを使用すると、パフォーマンスが大幅に向上します。一般に、非常に速く動く人々やぼやけたビデオは、低品質になることがあります。

顔の比較

Q: 顔の比較とは何ですか?

顔の比較は、ある顔を 1 つ以上の別の顔と比較して類似性を測定するプロセスです。Amazon Rekognition Image では、CompareFaces API を使用して 2 つの画像内の顔が同一人物である可能性を測定します。この API は、ソースの入力画像にある顔を、ターゲットの入力画像で検出されたそれぞれの顔と比較し、各比較について類似性のスコアを返します。また、検出されたそれぞれの顔の境界ボックスと信頼スコアも取得します。顔の比較を使用すると、ほぼリアルタイムで、ファイルにある人物の写真と比較して個人のアイデンティティを検証できます。

Q: 複数の顔が含まれるソース画像を使用できますか?

はい。ソース画像に複数の顔が含まれる場合、CompareFaces は、最も大きな顔を検出し、それを使用してターゲット画像で検出された各顔と比較します。

Q: いくつの顔と比較できますか?

ソース画像に含まれる 1 つの顔を、ターゲット画像で検出された最大 15 の顔と比較できます。

顔認識

Q: 顔認識とは何ですか?

顔認識は、顔コレクションの中から個人の顔を探すことで、特定の個人のアイデンティティを特定、または検証するプロセスです。顔認識を使用することで、銀行の支払いにおける多要素認証、従業員の入館自動化などのアプリケーションを簡単に構築できます。

Q: 顔コレクションとは何ですか? 顔コレクションはどのように作成できますか?

顔コレクションは、ユーザーが所有および管理する、顔の特徴ベクトルの検索可能なインデックスです。CreateCollection API を使用することで、サポートされている AWS リージョンでコレクションを容易に作成し、Amazon リソースネーム (ARN) を再度取得できます。各顔コレクションには、コレクションに関連付けられた一意の CollectionId があります。

Q: 顔コレクションに顔を追加、または顔コレクションから顔を削除するにはどうすればよいですか? 

既存の顔コレクションに顔を追加するには、IndexFaces API を使用します。この API は、S3 オブジェクトまたは画像のバイト配列の形式で画像を受け取り、検出された顔のベクトル表示を顔コレクションに追加します。また、IndexFaces は、追加された各顔の一意の FaceId と境界ボックスを返します。

既存の顔コレクションから顔を削除するには、DeleteFaces API を使用します。この API は、CollectionId を使用して提供された顔コレクションで動作し、FaceId のリストに対応するエントリを削除します。顔の追加と削除に関する詳細については、コレクションの管理の例を参照してください。

Q: 顔コレクション内の顔をどのように検索すればよいですか?

インデックスが付けられた顔コレクションを作成したら、画像 (SearchFaceByImage) または FaceId (SearchFaces) を使用してコレクション内の顔を検索できます。これらの API では、入力用の顔を取り込み、類似性のスコアが高い順に、一致する顔のセットを返します。詳細については、顔の検索の例を参照してください。

Q: 顔認識はビデオ分析でどのように異なるのですか?

Rekognition Video では、数千万の顔を持つコレクションに対してリアルタイムの顔検索を実行できます。まず、顔コレクションを作成します。顔コレクションでは、それぞれの顔が顔の特徴のベクトル表現として保存されます。Rekognition は顔コレクションの中で、ビデオ全体で視覚的に似ている顔を探します。ビデオ内の顔ごとに信頼スコアが出力されるため、一致する可能性の高いものをアプリケーションで表示できます。セキュリティと監視のアプリケーションでは、何百万人もの顔をリアルタイムで収集することで、容疑者を特定し、タイムリーで正確な防犯を可能にします。

Q: ビデオの解像度に加えて、Video の API の品質に他に何が影響するのでしょうか?

ビデオの解像度に加えて、検索する顔コレクションの要素である品質と代表顔は大きな影響を与えます。ひげ、眼鏡、ポーズ (側面と正面) のようなバリエーションで、人物ごとに複数の顔のインスタンスを使用すると、パフォーマンスが大幅に向上します。通常、非常に速く動く人々については感度が低下することがあります。また、ぼやけたビデオも低品質になることがあります。

有名人の認識

Q: 有名人の認識とは何ですか?

Amazon Rekognition の有名人の認識は、有名な、注目に値する、またはその分野で著名な個人を検出および認識するための深層学習ベースの使いやすい API です。RecognizeCelebrities API は、大きな規模で運用し、政治、スポーツ、ビジネス、エンターテインメント、メディアなど、さまざまなカテゴリの有名人を認識するように構築されています。有名人認識機能は、デジタル画像ライブラリを特定の関心に基づいて索引付けして検索する必要のあるお客様に最適です。

Q: 有名人認識 API によって誰を識別できますか?

Amazon Rekognition は、深層学習モデルが認識するようにトレーニングされた有名人のみを識別できます。RecognizeCelebrities API は、有名人の網羅的なリストに関する権威でもなく、そのようなものを目的としていないことに注意してください。この機能は、お客様のニーズとフィードバックに基づいて、できるだけ多くの有名人を含めるように設計されています。私たちは絶えず新しい名前を追加しています。しかし、有名人認識機能が、他の任意のグループまたは私たちのお客様によって著名であると思われる個人を認識しないという事実は、それらの有名人ステータスに関する私たちの見解を反映するものではありません。有名人認識機能によって識別される有名人を追加したい場合は、フィードバックを送信してください。

Q: Amazon Rekognition API 要求によって識別される有名人は、機能から削除されることを要求できますか?

はい。有名人が機能から削除されることを希望する場合は、AWS カスタマーサポートにメールを送信できます。私たちはその削除要求を処理します。

Q: 有名人に関する追加情報を提供するためにどんなソースがサポートされますか ?

API は、有名人に関する追加情報を提供するために、API 応答の一部としてソースのオプションリストをサポートします。現在は IMDB URL を提供しています (利用可能なとき)。後日、他のソースを追加する可能性があります。

Q: 有名人の認識はビデオ分析ではどのように異なっていますか?

Rekognition Video を使用すると、よく知られた人物がいつどこでビデオに登場するのかを検出し認識することができます。タイムコードが適用された出力には、有名人の名前と一意の ID、境界ボックスの座標、信頼スコア、有名人の関連コンテンツを指す URL (例: 有名人の IMDB リンク) が含まれます。有名人は、顔がビデオ内で遮られている場合でも検出されます。この機能を使用すると、特定のマーケティングやメディアのニーズに関連するユースケースについて、デジタルビデオライブラリをインデックス付けして検索することができます。

Q: ビデオ解像度に加えて、Rekognition Video の API の品質には他に何が影響するのですか?

非常に速く動く有名人やぼやけたビデオは、Rekognition Video の API の品質に影響を与える可能性があります。加えて、俳優/女優に共通する濃いメイクやカモフラージュも、品質に影響を与える可能性があります。

Text in Image

Q: Text in Image はどのような機能ですか?

Text in Image は、画像内にある街区名、字幕、製品名、自動車のナンバープレートなどのテキストを簡単に検出および認識できる Amazon Rekognition の機能です。Text in Image は、文書画像ではなく現実の画像を対象として機能するように構築されています。Amazon Rekognition の DetectText API により、画像が取り込まれ、検出された各文字列について、テキストラベルと境界ボックスが信頼スコアと共に返されます。例えば、画像共有やソーシャルメディアプリケーション内で、同じテキストラベルを含む画像のインデックスに基づくビジュアル検索を実現できます。メディアやエンターテイメントのアプリケーションでは、ビデオフレームのテキストメタデータを作成し、ニュース、スポーツの得点、コマーシャル、字幕といった関連コンテンツの検索をサポートできます。セキュリティや調査のアプリケーションでは、ボディカメラや交通監視カメラで撮影された画像のナンバープレートから車両を特定できます。

Q: Amazon Rekognition の Text in Image ではどのような文字の種類がサポートされていますか? 

Text in Image は、文書画像ではなく現実の画像を対象として機能するように構築されています。多種多様なレイアウト、フォント、スタイルで埋め込まれ、背景のオブジェクトにさまざまな向きで重ねられたバナーやポスターのほとんどのラテン文字や数字のテキストがサポートされます。Text in Image では 1 画像につき最大 50 個の文字列が認識され、単語および行としてリスト化されます。また、Text in Image では、傾き +/- 30 度以内の水平方向テキストのみが認識されます。

Q: テキスト認識を改善するために Rekognition に関するフィードバックを行うには、どうすればよいですか?

AWS カスタマーサポートからリクエストをお送りください。Amazon Rekognition では、お客様からのフィードバックに基づいて、継続的に認識されるテキストコンテンツを拡大していきます。

ビデオ分析

Q: Amazon Rekognition Video の非同期 API はどのように機能しますか?

Rekognition Video は、Amazon S3 バケットに格納されたビデオを処理します。デザインパターンは、非同期の操作セットです。StartLabelDetection などの Start 操作を呼び出してビデオ分析を開始します。リクエストの完了ステータスは、Amazon Simple Notification Service のトピックに公開されます。Amazon SNS トピックから完了ステータスを取得するには、Amazon Simple Queue Service のキューまたは AWS Lambda 関数を使用できます。完了ステータスを取得したら、GetLabelDetection などの Get 操作を呼び出して要求の結果を取得します。

 

Q: 人物追跡とは何ですか?

Rekognition Video を使用すると、ショット内の各人物を追跡したり、ビデオ全体のショット間で追跡したりすることができます。Rekognition Video は、カメラが動いていても人物を検出し、それぞれの人物について、境界ボックスと顔、および顔の属性とタイムスタンプを返します。セキュリティと監視のアプリケーションでは、これにより、個人の調査と監視が簡単かつ正確になります。小売業のアプリケーションでは、これにより、お客様のショッピングモール内での動線や、レジでの待ち時間など、お客様に関する洞察を生成することができます。

Q: リアルタイムで動画を分析するにはどうすればよいですか?  

ストリーミングモードでは、数千万の顔を持つコレクションに対してリアルタイムで顔を検索できます。Rekognition Video の顔検出および顔認識 API は、開発者が数千のライブフィードおよび関連メタデータを送信できるサービスである Amazon Kinesis Video Streams のビデオストリームとネイティブに統合されています。セキュリティアプリケーションでは、これにより容疑者のリアルタイムの識別が簡単かつ正確になります。

Q: Amazon Rekognition Video は Amazon Kinesis Video Streams で動作しますか?

Rekognition Video は、入力として Kinesis Video Stream を使用して、ビデオストリームを処理します。分析結果は Rekognition Video から Kinesis データストリームに出力され、最後にクライアントアプリケーションによって読み取られます。Rekognition Video は、ストリーミングビデオの分析を開始および管理するために使用できるストリームプロセッサーを提供します。詳細については、Working with Streaming Videos を参照してください。

請求

Q: Amazon Rekognition では、処理された画像の数はどのように計算されますか?

入力として画像を受け取る API において、Amazon Rekognition では実際に分析された画像の数を処理された画像の数として計算します。DetectLabels、DetectModerationLabels、DetectFaces、IndexFaces、RecognizeCelebrities、および SearchFaceByImage がこのカテゴリに属します。入力として 2 つの画像が渡される CompareFaces API においては、ソース画像のみが処理される画像の単位として計算されます。

入力パラメータとして画像を必要としない API コールにおいては、Amazon Rekognition では各 API コールに対して画像が 1 つ処理されたと計算します。SearchFaces および ListFaces がこのカテゴリに属します。

その他の Amazon Rekognition API (DeleteFaces、CreateCollection、DeleteCollection、および ListCollections) では、処理される画像として計算されません。

Q: Amazon Rekognition では、処理されたビデオの経過時間 (分) はどのように計算されますか?

アーカイブされたビデオの場合、Amazon Rekognition は、API によって正常に処理されたビデオの経過時間 (分) をカウントし、請求対象としてそれらを計測します。ライブストリームビデオの場合、処理が正常に完了したビデオが 5 秒ごとのチャンクで課金されます。

Q: Amazon Rekognition で課金の対象となる API はどれですか?

Amazon Rekognition Image は DetectLabels、DetectModerationLabels、DetectFaces、IndexFaces、RecognizeCelebrities、SearchFaceByImage、CompareFaces、SearchFaces、および ListFaces に対して料金を請求します。Amazon Rekognition Video の料金は、StartLabelDetection、StartFaceDetection、StartFaceDetection、SatrtContentModeration、StartPersonTracking、StartCelebrityRecognition、StartFaceSerach、および StartStreamProcessor API で正常に処理された動画の長さ (分) に基づいています。

Q: Amazon Rekognition のコストはどれくらいですか?

最新の料金情報については、Amazon Rekognition の料金ページを参照してください。

Q: 顔コレクションに保存した特徴ベクトルに対して課金されますか?

はい。Amazon Rekognition では、顔ベクトル 1,000 個につき、1 か月あたり 0.01 ドル課金されます。詳細については、料金ページを参照してください。

Q: Amazon Rekognition は AWS の無料利用枠で利用できますか?

はい。AWS 無料利用枠の一環として、Amazon Rekognition を無料で使用開始できます。サインアップすると、Amazon Rekognition を初めて使用するお客様は、最初の 12 か月間、毎月最大 5,000 の画像を無料で分析できます。この無料利用枠では、すべての Amazon Rekognition API を使用できます。また、最大 1,000 の顔を無料で保存できます。さらに、Amazon Rekognition Video のお客様は、最初の 1 年間は 1 か月間に 1,000 分、ビデオを無料で分析することができます。

Q: 価格には税金が含まれていますか?

税金の詳細については、アマゾン ウェブ サービス税務ヘルプを参照してください。

AWS の統合

Q: Amazon Rekognition Video は、Amazon S3 に保存された画像を処理できますか?

はい。S3 バケットに対して Amazon Rekognition API を指定するだけで、Amazon S3 に保存された画像の分析を開始できます。データを移動する必要はありません。Amazon Rekognition の API コールで S3 オブジェクトを使用する方法の詳細については、ラベル検出の演習を参照してください。

Q: 別のリージョンの Amazon S3 バケットに保存されている画像で Amazon Rekognition を使用することはできますか?

いいえ。使用する Amazon S3 バケットが Amazon Rekognition API エンドポイントと同じリージョンであることを確認してください。

Q: Amazon Rekognition を使用して複数の画像ファイルをバッチ処理するにはどうすればよいですか?

GitHub にある Amazon Rekognition のバッチ処理の例で説明されているステップを使用して、Amazon S3 画像を一括で処理できます。

Q: どのように AWS Lambda を Amazon Rekognition と連携させて使用できますか?

Amazon Rekognition では AWS Lambda にシームレスにアクセスできます。Amazon S3 や Amazon DynamoDB など AWS データストアに対してトリガーに基づく画像分析が可能になります。Amazon Rekognition と AWS Lambda を連携させるには、こちらで説明されているステップを実行し、Amazon Rekognition の設計図を選択してください。

データプライバシー

Q: Amazon Rekognition で処理された画像とビデオの入力は保存されていますか? それらは AWS でどのように使用されていますか?

Amazon Rekognition は、サービスの提供と保守、Amazon Rekognition や他の Amazon 機械学習/人工知能技術の品質の向上のためにのみ、サービスによって処理された画像とビデオの入力を保存して使用することができます。関連する技術の開発やトレーニングを含め、Amazon Rekognition のお客様体験を継続的に改善するには、コンテンツの使用が不可欠です。私たちは、お客様やエンドユーザーに製品、サービス、またはマーケティングを目的として、コンテンツに含まれる個人を特定できる情報を使用することはありません。お客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティが AWS の最優先事項です。また、AWS では、転送中や保管時の暗号化など、お客様のコンテンツへの不正アクセスやお客様のコンテンツの公開を防ぐように設計された、高度で信頼できる技術的および物理的な規制を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://aws.amazon.com/compliance/data-privacy-faq/ を参照してください。

Q: Amazon Rekognition に保存されている画像とビデオの入力を削除できますか?

はい。お客様のアカウントに関連する画像およびビデオの入力の削除リクエストについては、AWS サポートにお問い合わせください。画像とビデオの入力を削除すると、Amazon Rekognition エクスペリエンスの質が低下する可能性があります。

Q: Amazon Rekognition で処理され、保存されているコンテンツにアクセスできるのは誰ですか?

許可された従業員だけが Amazon Rekognition によって処理されるコンテンツにアクセスできます。AWS はお客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティを最優先しています。また、AWS では、不正なアクセスやお客様のコンテンツが公開されることを防ぐように設計された、保存中または通信中の暗号化を含む高度で適切な技術的および物理的な制御を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://aws.amazon.com/compliance/data-privacy-faq/ を参照してください。

Q: Amazon Rekognition で処理され、保存されているコンテンツは、誰の所有物になりますか?

あなたのコンテンツの所有権は常にあなたが保持し、私たちはあなたの同意を得たコンテンツのみを使用します。

Q: Amazon Rekognition で処理されたコンテンツは、Amazon Rekognition を使用している AWS リージョン外に移動していますか?

Amazon Rekognition で処理されたすべてのコンテンツは暗号化され、お客様が Amazon Rekognition を使用している AWS リージョンから移動されずに保管されます。Amazon Rekognition で処理されたコンテンツの一部は、Amazon Rekognition のカスタマーエクスペリエンスやその他の Amazon 機械学習/人工知能技術の継続的な改善と開発に関連する場合のみ、別の AWS リージョンに保存されることがあります。お客様のアカウントに関連する画像およびビデオの入力の削除リクエストについては、AWS サポートにお問い合わせください。AWS はお客様からの信頼、プライバシー、およびお客様のコンテンツのセキュリティを最優先しています。また、AWS では、不正なアクセスやお客様のコンテンツが公開されることを防ぐように設計された、保存中または通信中の暗号化を含む高度で適切な技術的および物理的な制御を行っています。さらに、AWS がデータを使用する場合はお客様との契約を確実に遵守します。詳細については、https://aws.amazon.com/compliance/data-privacy-faq/ を参照してください。

Q: 13 歳未満のお子様を対象としていて、児童オンラインプライバシー保護法 (COPPA) を順守する必要があるウェブサイト、プログラム、その他のアプリケーションに関連して Amazon Rekognition を使用することはできますか?

はい。必要な注意喚起および COPPA に基づく証明可能な親の同意の取得の義務を含む Amazon Rekognition サービス条件の順守を前提として、 13 歳未満のお子様を対象としたウェブサイト、プログラム、またはその他のアプリケーション全体または一部に関連して Amazon Rekognition を使用することができます。

Q: 自分のウェブサイト、プログラム、またはアプリケーションが COPPA の対象かどうかを知るにはどうすればよいですか?

COPPA の要件に関する情報、およびお客様のウェブサイト、プログラム、またはその他のアプリケーションが COPPA の対象かどうかを確認するためのガイダンスについては、米連邦取引委員会が提供および保持するリソースを直接参照してください。このサイトには、サービスが全体的または部分的に、13 歳未満のお子様を対象としているかどうかを確認する方法についての方法も記載されています。

アクセスコントロール

Q: Amazon Rekognition のユーザーアクセスはどのように管理すればよいですか?

Amazon Rekognition は AWS Identity and Access Management (IAM) に統合されています。AWS IAM のポリシーを使用して、許可されたユーザーのみが Amazon Rekognition API にアクセスするようにできます。詳細については、Amazon Rekognition の認証とアクセスコントロールに関するページを参照してください。

Amazon Rekognition 料金の詳細

料金ページを見る
構築を始めましょう。
AWS Rekognition の開始方法
ご不明な点がおありですか?
お問い合わせ