Category: Amazon Rekognition*


Amazon Rekognition がリアルタイム顔認識、イメージ内のテキスト認識のサポート、および機能強化された顔検出を発表

Amazon Rekognition に、3 つの新しい機能として、イメージ内のテキストの検出と認識、数千万の顔からのリアルタイム顔認識、および密集写真からの最大 100 個の顔検出が追加されました。顔の検証と識別に Amazon Rekognition をすでにご利用の場合は、ほとんどのケースで精度が最大 10% 向上します。

イメージ内のテキスト

Amazon Rekognition でイメージ内のオブジェクトや顔を検出しているお客様方から、イメージに埋め込まれたテキストを認識できないかとのご要望があります。たとえば、交通監視カメラで捉えた道路標識や車のナンバープレート、TV 画面のニュースや字幕、携帯に取り込まれた家族写真の図案化された文字などです。本日より、Rekognition の「イメージ内のテキスト」を使用して、イメージからテキストコンテンツを認識して抽出できるようになりました。「イメージ内のテキスト」は、ドキュメントのイメージよりも実際のイメージで特に効果を発揮するように構築されています。多種多様なレイアウト、フォント、スタイルで埋め込まれたほとんどのラテン文字や数字のテキストがサポートされます。また、バナーやポスターなどの背景のオブジェクトに様々な向きで重ねられたテキストもサポートされます。

「ビジュアル駆動型のプラットフォームである Pinterest では、イメージの速度と画質が極めて重要ですが、これらのイメージに付随するテキストも同じように重要です。テキストは、当社の 2 億を超えるアクティブユーザーに実際に Pin するための背景情報を提供します。Amazon Rekognition の『イメージ内のテキスト』を使うことで、大量のイメージに取り込まれたリッチテキストが抽出しやすくなり、Amazon S3 に保存された何百万という Pin のレイテンシーを低く抑えることができます。これからも AWS とのパートナーシップを深め、Pinner に高品質で高速なサービスを提供し、Pinterest のビジネスを成長させていくつもりです。」– Vanja Josifovski、CTO、Pinterest

「プロの写真家が SmugMug を使用して共有したり販売したりする写真に、マラソン大会のゼッケン番号などの数字が含まれていることがあります。Amazon Rekognition の『イメージ内のテキスト』を使用すると、大量のゼッケン番号をプログラムで抽出できるため、これらの大会で写真家が撮った写真をすばやく簡単に共有したり収益化したりできるようになります。」 – Don MacAskill、Co-founder、CEO & Chief Geek at SmugMug

リアルタイムの顔認識

何千万という顔のコレクションに対してリアルタイムの顔検索ができるようになりました。これにより、検索のレイテンシーが以前よりも 5〜10 分の 1 に短縮されると共に、コレクションに保存できる顔の数が 10〜20 倍に増えます。セキュリティと公共安全のアプリケーションでは、今回の更新により、何百万という顔のコレクションから目当ての人物をリアルタイムで識別できます。これは、迅速なレスポンスが要求されるユースケースに役立ちます。

ワシントン郡保安官オフィスは、オレゴン市民からの 911 番緊急通報に対するファーストレスポンダーです。このオフィスでは、全国の市警に対して犯罪防止のサポートも提供しています。昨年から Amazon Rekognition を使い始め、通報された容疑者の識別所要時間を 2〜3 日から数分に短縮し、新しいシステムを使用して最初の容疑者を 1 週間以内に逮捕しました。

「この改善により、現場の警察官はほぼリアルタイムで検索の結果を得られます。必要な情報を取得してすばやく対応できます。現場では、数秒の差が人命救助の分かれ目になることがあります。」– Chris Adzima、上級インフォメーションシステムアナリスト、ワシントン郡保安官オフィス

人混みモードの顔検出

本日より、1 つのイメージに含まれている多数の顔から最大 100 (以前は 15) までを検出、分析、インデックスできるようになりました。この機能強化により、グループ写真、混雑したイベントや公共の場所 (空港やデパートなど) の写真で、すべての顔の人口統計データを正確にキャプチャしてセンチメントを分析できます。

「過去にユーザーが購入した写真や、ユーザーから当社のプラットフォームにアップロードされた写真の膨大なコレクションがあります。これらのコレクションから特定のユーザーの子供の写真を探す場合があり、そのために Amazon Rekognition を利用しています。多くのグループ写真には何十という小さな顔が収められていて、これまでは 1 つ 1 つの顔を正確に検出するために元のイメージをトリミングして分割していました。新しい人混みの顔検出機能を使用すると、特に複雑な前処理をすることなく、一度ですべての顔を簡単に検出できます。」– Shinji Miyazato、Engineering Department SRE Lead、Sen Corporation

顔検出モデルの精度向上

顔検出アルゴリズムの精度も改善しました。これにより、チェックインカウンターや従業員用の回転式通用口、モバイルの顔ベースの認証で使用される顔検証/識別アプリケーションの精度が最大 10% 向上します。

特に注目に値する点として、さまざまな業界で大規模なイメージ分析ワークロードを本稼働環境で運用するお客様が増えています。代表的なお客様の例をいくつかご紹介します。

Butterfleye – この家庭および小規模企業向けのセキュリティカメラプロバイダーは、Amazon Rekognition を使用して顔/物検出カメラを低コストで迅速に開発し、開発所要時間を 18 か月から 4 か月に短縮して研究開発費を 100 万ドル以上削減しました。

Open Influence – この会社の業務は、エンタープライズ顧客がブランドを販売促進するためのソーシャルメディアインフルエンサーを見つけることです。Amazon Rekognition を自社独自のデータパイプラインと簡単に連携させることで高品質の検索結果を生成し、他の手段では見つけることができなかったインフルエンサーを顧客が発掘できるようにしています。

Marinus Analytics – 人身売買の防止に Amazon Rekognition を役立てています。この会社の主力ソフトウェアは、米国の法執行機関で性目的の人身売買の捜査に採用されています。Amazon Rekognition と Marinus Analytics を連携させた捜査により、何百万という記録から数秒で被害者を見つけ出し、迅速で効果的な対応ができます。

Amazon Rekognition の詳細については、こちらを参照してください。Amazon Rekognition をすぐに使用するには、こちらの開始方法を参照してください。ご質問があればコメント内に記入してください。


Ranju は、Amazon での勤務歴がほぼ 5 年で、Amazon Rekognition チームを率いています。Amazon Rekognition は、ディープラーニングベースのイメージ認識サービスであり、何百万というイメージを検索、検証、整理できます。Ranju は Amazon の前に Barnes & Noble で Nook Cloud エンジニアリングのチームリーダーでした。このチームは、Nook モバイルサービスおよびデジタルアセット管理サービスの戦略、設計、開発、および SaaS 運用を担当していました。

Amazon Rekognition とグラフデータベースを使って映画スターのソーシャルネットワークを理解する

Amazon Rekognition は、イメージの分析をアプリケーションに簡単に追加できるようにする AWS サービスです。ディープラーニングを活用したこのコンピュータビジョン向け API に追加された最新機能が、有名人の認識です。この使いやすい機能は、各分野の有名人や著名人を多数検出、認識します。このツールにより、ユーザーは自身の関心に基づいて有名人のデジタルイメージライブラリのインデックスを作成し、検索することができます。

当社のお客様が個人に関するデータの保存に用いる一般的な方法の 1 つが、グラフデータベースです。過去のブログ投稿で詳しく説明したとおり、Facebook や LinkedIn、Twitter といった企業は巨大な関係性ネットワークの管理能力を通じ、社会が相互に関わり合う方法を革新してきました。このブログ投稿の目的は、Rekognition の有名人の認識および顔認識機能をグラフデータベースに保存された関係情報に組み合わせるのがいかに簡単かをご紹介することです。

これらのテクノロジーを組み合わせることで、お客様は 1 枚の写真を通じて、その写真に含まれる人物が他の関心対象である人物とどのように関連しているかを把握できます。さらに、2 枚の写真を送信し、それぞれの写真に含まれる人々の間にどのような相互関係があるかを素早く見極めることも可能です。この関係マッピングを活かしたコミカルな例が、有名な Six Degrees of Kevin Bacon (ケヴィン・ベーコンとの六次の隔たり) ゲームです。しかし、このようなアプリケーションのビジネス価値は実に大きなものです。法執行機関は 2 枚の写真を基に Rekognition を活用して各人物の身元を特定し、グラフデータベースを参照して関心対象である 2 名の人物が知り合いかどうかを突き止めることができます。同様に、ホスピタリティ企業は Rekognition とグラフデータベースを使って敷地内にいる有名人を素早く特定し、その人物の知り合いである他の有名人のうち、近隣に宿泊している人物を把握できます。

このブログ投稿では、グラフデータベース (ここでは Neo4j Community Edition を使用) を採用した Rekognition と、D3.js ライブラリを使用した Jupyter Notebook の併用方法のデモンストレーションをご紹介します。

設定

このテクノロジーの組み合わせの使用を開始するには、まず AWS ラボの Github リポジトリからプロジェクトのコピーを取得します。  プロジェクト構成には 2 つの主なエリアが含まれます。

  • <project root> – ここに、実際の Jupyter Notebook がすべての依存関係とともに保存されています。
  • <project root>/cft – インフラストラクチャを作成するための AWS CloudFormation テンプレートおよびサンプルプロパティ、サンプルコマンド。

ここに新たな/既存の ssh キーを追加する必要があります。AWS CloudFormation テンプレートが Neo4j Community Edition をインストールし、Rekognition を操作するための Python コード例を含む Jupyter Notebook を AWS ラボからダウンロードして、スピーディな利用開始に必要となるその他の Amazon EC2 設定を構成します。また、Cloud Formation テンプレートが Neo4j ブラウザまたは Jupyter Notebook のいずれかのクエリ対象となる一般的なムービーグラフデータベースを自動的にロードします。

(more…)

Amazon Rekognition の更新 – 有名人の認識

re:Invent で Amazon Rekognition をリリースし (「Amazon Rekognition – ディープラーニングがサポートする画像の検出と認識 (Amazon Rekognition – Image Detection and Recognition Powered by Deep Learning))、本年初頭にイメージモデレーションを追加しました。本日は、有名人の認識を追加します。Rekognition のトレーニングにより、政治、スポーツ、芸能、ビジネス、メディアなどの分野の有名人や著名人を多数識別できるようになりました。このリストはグローバルで、頻繁に更新されます。この機能にアクセスするには、新しい RecognizeCelebrities関数を呼び出します。既存の DetectFaces 関数によって返される境界ボックスおよび顔ランドマーク機能に加えて、新しい関数では認識される有名人に関する情報が返されます。

"Id": "3Ir0du6", 
"MatchConfidence": 97, 
"Name": "Jeff Bezos", 
"Urls": [ "www.imdb.com/name/nm1757263" ]

Urls は、有名人に関する追加情報を提供します。現在、この API は IMDB コンテンツへのリンクを返します。今後は他のソースを追加する可能性があります。この機能をお試しになるには、AWS Management Console有名人の認識デモをお使いください。

イメージアーカイブを持っている場合は、有名人別にインデックスを作成できます。有名人の認識とオブジェクトの検出を組み合わせて使用して、あらゆる種類の検索ツールを構築することもできます。イメージが S3 にすでに保存されている場合は、そこで処理できます。この新機能には、いろいろな面白い使い方があるかと思います。ご意見ご感想をお寄せいただき、皆様がどのようなものをビルドしたかお知らせください。

Jeff;

Amazon Rekognitionアップデート – 画像の節度

我々は昨年Amazon Rekognitionを発表し、私のブログポスト(Amazon Rekognition – 深層学習による画像検出と認識)でご紹介しました。その時ご説明した様に、このサービスは毎日数十億枚の画像を何年にも渡って解析を続けている我々のコンピュータビジョンチームによって作られました。

本日、我々はRekognitionに画像の節度の機能を追加致します。もしユーザにプロフィール写真やその他の画像をアップロードさせる様なウェブサイトやアプリケーションをお持ちでしたら、きっとこの新しいRekognitionの機能を気に入って頂けると思います。

Rekognitionはあなたのサイトに不適切な、いやらしさや露骨な内容を含む様な画像を特定することができます。節度ラベルは詳細なサブカテゴリを提供してくれるので、許容できるまたは不快と思う様な画像のフィルタリングを細かくチューニングすることができます。この機能を使って、画像共有サイト、フォーラム、デートアプリ、子供向けコンテンツプラットフォーム、eコマースのプラットフォームやマーケットプレイス等々を改善することができます。

この機能を使うためには、コードからDetectModerationLabrels関数を呼び出します。レスポンスの中には組み込み済みの分類の中からいくつかの節度ラベルが含まれます:

"ModerationLabels": [ 
  {
    "Confidence": 83.55088806152344, 
    "Name": "Suggestive",
    "ParentName": ""
   },
   {
    "Confidence": 83.55088806152344, 
    "Name": "Female Swimwear Or Underwear", 
    "ParentName": "Suggestive" 
   }
 ]

AWS Management Consoleではこの機能を実験するための画像節度デモを使うことができます:

画像の節度は今日からご利用可能です!

Jeff;

原文: Amazon Rekognition Update – Image Moderation (翻訳: SA岩永)

 

Amazon Rekognitionを使ってMacOS Finderのタグ機能を更に良いものにしよう

こちらは、AWSのGlobal Startup EvangelistであるMackenzie Kosut(@mkosut)によってAWS Startups Blogに投稿された「Using Amazon Rekognition to enhance MacOS Finder Tags」の翻訳記事です。


日曜の朝、私はラップトップにある何百枚もの写真が保存されている大きなフォルダを眺めていました。サムネイルは素晴らしいのですが、私が本当にやりたかったことは、簡単にそしてクイックに”崖”の写真を探し当てることでした。

OS X Mavericksからタグ機能が使えるようになり、Finderウインドウでタグ付けされたファイルを探せるようになっています。そこで、私はラップトップからAmazon Rekognitionに写真を送信し、それぞれの写真についてAmazon RekognitionのDeep Learningベースの画像認識を行い、そして、識別情報をタグとしてファイルに登録し、Finderでそのファイルを開けるようにする、という一連の処理に関してどの程度の手間がかかるのか知りたいと思っていました。

これが実現できると、FinderもしくはSpotlight(MacOSの検索機能)において、Tag:<term>という形で検索できるようになります。例えば、全ての猫(cat)の写真を引き当てたい場合は Tag:Cat と入力することで結果を得ることが出来る、というものです。

writexattrsファンクションのコードスニペットをオンラインで見つけた後、そうこうするうちに、Amazon Rekognitionに写真を送り、Tagの結果を得て、それらをファイルに登録することが出来てしまいました。約30分の間に50行ほどのコードを書いて、それが実際に動作するプロトタイプになりました。

コードは https://github.com/mkosut/rekognition_osx_tagfile にありますので、是非ご覧になさってください。

多数の写真がある大きなフォルダーについても正しく動作しました。そして、パフォーマンス向上のため、アップロードの前にイメージのリサイズを行い、プロセスをマルチスレッドで行えるようなpull requestをチームの中のメンバーが送ってくれました。

私が本当に欲しかったものは、画像がフォルダに追加された時に自動でタグ付けされる、というものでした。私はそのためにMacOS Automatorを活用しました。Automatorでは使い勝手の良い簡単なインターフェースを通じてフォルダーのアクティビティをウォッチすることができ、新しいファイルが書き込まれたらアクションを走らせることができます。これはAmazon S3にファイルのファイルが変更された時にAWS Lambdaの処理をいつでも自動的に稼働させるものと似ていると言えるでしょう。

このワークフローは”TagMe”フォルダーに新しいファイルが書き込まれるのを待ち受け、それらを rek_osx_tagfile.py スクリプトにファイル名をパラメーターとして渡して起動します。

それでは最終テストです:

成功しました!

このhackを通して私は大きな気付きを得ました。それは、AWSはどんなことにも活用できるケーパビリティを持っているということです。ここには非力な1台のラップトップしかありませんが、私はAmazon Rekognitionの巨大なDeep Learning基盤を用いることで大量の写真の解析をすることができましたし、何より少ないコードでそれを実現できました!

 

翻訳:篠原英治(原文:「Using Amazon Rekognition to enhance MacOS Finder Tags」 – https://aws.amazon.com/blogs/startups/using-amazon-rekognition-to-enhance-macos-finder-tags/

Amazon Rekognition の更新 – 顔の推定年齢範囲

Amazon Rekognition は当社の人工知能サービスの 1 つです。Rekognition では、画像内の物体、シーン、および顔を検出できるほか、顔を検出して比較することができます。Rekognition は、バックグラウンドで詳細な神経ネットワークモデルを使用して、毎日数十億の画像を分析しています (詳細については、「Amazon Rekognition – ディープラーニングによる画像の検出と認識」を参照してください)。Amazon Rekognition は、画像で見つけた顔ごとに属性の配列を返します。本日、推定年齢範囲という新しい属性を追加します。この値は年数で表され、整数のペアとして返されます。年齢範囲は重なる場合があります。つまり、5 歳の顔の推定範囲は 4~6 歳になるが、6 歳の顔の推定範囲は 4~8 歳となる場合があります。この新しい属性を使用すれば、公共安全アプリケーションの増強、人口動態の収集、必要な期間を対象とした写真の整理が可能になります。この新機能を少し楽しむため (私はこの投稿を金曜日の午後に書いています)、自分の写真アーカイブを掘り起こして、Rekognition に私の年齢を推定させてみました。答えは次のようになりました。最初から始めましょう。この写真では、おそらく私は 2 歳でした。

この写真は、1966 年の春に私の祖母の家で撮られたものです。

私は 6 歳でした。Rekognition は私の年齢を 6~13 歳と推定しました。

2003 年の私の最初の公式な Amazon PR 写真では、私は 43 歳でした。

これには 17 年の範囲があり、私の実年齢はちょうどその中間でした。そして私の最新の (2015 年後半) の PR 写真 (55 歳) です。

これもまたかなり幅がありますが、私の年齢はちょうど中間です。一般的に、顔の実年齢は Rekognition で示された年齢の範囲に収まりますが、正確に中間になることを当てにしないでください。この機能は提供が開始されており、今すぐ使い始めることができます。

Jeff;