Amazon Web Services ブログ

Amazon Rekognition が、顔の検出、分析、認識機能の更新を発表

本日、当社は顔の検出、分析、認識機能の更新を発表いたします。これらの更新により、画像からより多くの顔を検出し、より正確な顔のマッチングを実行し、画像内の顔から年齢、性別、感情の属性を取得する能力が向上します。Amazon Rekognition の顧客は、本日より、追加コストなしでこれらの各機能拡張を使用できます。機械学習の経験は必要ありません。

「顔検出」は、「この画像には顔がありますか?」という質問に答えようとします。 現実世界の画像では、さまざまな側面が、高い精度で顔を検出するシステムの能力に影響を与える可能性があります。そうした側面としては、頭部の動きおよび/またはカメラの動きによるポーズの変化、前景または背景の物体 (前景にいる他の人の帽子、髪、手で覆われた顔など)によるオクルージョン、照明の変化 (低いコントラストや影など)、顔が白っぽくなる明るい照明、ノイズが多かったり不鮮明である顔につながる低品質と解像度、カメラやレンズ自体の歪みなどがあります。こうした問題は、未検出 (顔が検出されなかった) または誤検出 (画像領域に顔がないのに顔として検出される) として現れます。たとえば、ソーシャルメディアのさまざまなポーズでは、カメラのフィルター、照明、オクルージョン (「フォトボム」など) が一般的です。金融サービスの顧客の場合、多要素認証および不正防止ワークフローの一部としての顧客 ID の検証で、高解像度の自撮り (顔画像) を、写真 ID 文書 (パスポートや運転免許証など) のより低解像度で、小さく、しばしばぼやけた顔画像と照合させることが必要になります 。また、多くの顧客は、カメラが明るい光に向いている画像から低コントラストの顔を検出して認識しなければならなりません。

最新の更新により、Amazon Rekognition は前に説明した最も困難な条件にある画像で、以前は見逃されていた顔の 40% を検出できるようになりました。同時に、誤検出の割合は 50% 削減されています。つまり、ソーシャルメディアアプリなどの顧客は、高い確度で一貫して信頼できる検出 (未検出と誤検出が少ない) が可能になり、自動化されたプロフィール写真レビューなどのユースケースでより良い顧客経験を提供できます。さらに、顔認識は、大規模な顔のコレクションを検索する場合に、以前のモデルと比較して 30% より正確な「最良の」一致 (最も類似した顔) を返します。これにより、不正防止などのアプリケーションでより良い検索結果を得ることができます。顔照合では、さまざまな照明、ポーズ、外観でより一貫性のある類似性スコアを取得できるようになり、ID 照合などのアプリケーションでより高い信頼性のしきい値を使用して誤った一致を回避し、人間による確認を減らすことができます。いつものように、市民の自由や顧客の感情が関係するユースケースで照合の正確さが重要な場合、ベストプラクティス、より高い信頼水準 (少なくとも99%) を使用し、必ず人間による確認を含めることをお勧めします。

それでは、いくつかの画像を見て、Amazon Rekognition が制約のない環境でキャプチャされた難しい画像のさまざまな側面をどのように処理するかを確認しましょう。

ポーズのバリエーション

この問題は、急なカメラアングル (顔の上または下から撮影されたショットなど)、顔を横から見たショット、被写体が遠ざかっている場合に発生します。この問題は、ソーシャルメディアの写真 (例えば、被写体が遠くを見ているときなど)、自撮り、ファッションの写真撮影でよく見られます。顔検出アルゴリズムは、多くの場合、顔の半分以下しか見えないか、顔が通常ではない確度で傾いている (逆さまになるなど) 場合に、顔を検出することが困難です。

画像 1: 横から見た顔

画像 2: 様々な角度でカメラを見下ろす顔

画像 3: 空を眺め、カメラから離れている人物

難しい照明

コントラストが低い、ライトが少なく設定されている、コントラストが極端であるなどのため、照明が難しい場合があります。このパターンは、ストック写真やイベント会場でよく見られます。顔検出アルゴリズムはこうした例では苦労する可能性があります。なぜなら、照明が低くて顔の特徴と背景とのコントラストが不十分であったり、または明るい照明のために顔の特徴が洗い流されて識別が困難になったりするからです。

画像 4: 顔に明るい照明

画像 5: コントラストが低く、顔に影がある

画像 6: 極端なコントラスト

不鮮明またはオクルージョン

この課題は、芸術的エフェクト (自撮りまたはファッション写真、ビデオモーションブラー)、物体、ペイントまたは髪による部分的なオクルージョン (ファッション写真)、理想的ではないシャープネス (ID 文書から撮影した写真) がある写真で見られます。こうした場合、顔の特徴のすべてがはっきりと見えないので、顔の検出は困難です。

画像 7: 髪によって妨げられている顔

画像 8: 手やその他の物によって妨げられている顔

顔の検出と認識の更新は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、AWS GovCloud (米国)、欧州西部 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シドニー) の Amazon Rekognition をサポートしているすべての AWS リージョンで利用できるようになりました。開始するには、Amazon Rekognition コンソールで最新バージョンを試し、ドキュメントを参照してください。


まとめ

Ranju Das は、約 5 年間 Amazon で働いており、数百万の画像を検索、検証、整理することができる、深層学習ベースの画像認識サービスである Amazon Rekognition のリーダーです。Amazon に入社する前、Ranju はバーンズ・アンド・ノーブルで働いており、Nook Cloud のエンジニアリング責任者でした。彼のチームは、Nook モバイルサービスおよびデジタル資産管理サービスの戦略、設計、開発、SaaS 運用を担当していました。

 

 

Venkatesh Bagaria は、Amazon Rekognitionの上級製品マネージャーです。彼はAWSの顧客向けに、力強くても簡単に使えるディープラーニングベースの画像および映像分析サービスの構築に焦点を当てています。彼は空いた時間に、大量のスタンダップコメディスペシャルと映画を見たり、スパイシーなインド料理を作ったり、ギターを弾けるふりをしたりしています。