投稿日: Nov 21, 2017

Amazon Rekognition に、3 つの新しい機能として、イメージ内のテキストの検出と認識、数千万の顔からのリアルタイム顔認識、および密集写真からの最大 100 個の顔検出が追加されました。顔の検証と識別に Amazon Rekognition をすでにご利用の場合は、ほとんどのケースで精度が最大 10% 向上します。 

イメージ内のテキスト: Amazon Rekognition でイメージ内のオブジェクトや顔を検出しているお客様方から、交通監視カメラで捉えた道路標識や車のナンバープレート、TV 画面上のニュースや字幕、携帯に取り込まれた家族写真上の図案化された文字など、イメージに埋め込まれたテキストを認識できないかとのご要望があります。本日より、Rekognition の「イメージ内のテキスト」を使用して、イメージからテキストコンテンツを認識して抽出できるようになりました。「イメージ内のテキスト」は、ドキュメントのイメージよりも実際のイメージで特に効果を発揮するように構築されています。多種多様なレイアウト、フォント、スタイルで埋め込まれ、背景のオブジェクトに様々な向きで重ねられたバナーやポスターのほとんどのラテン文字や数字のテキストがサポートされます。

たとえば、イメージ共有やソーシャルメディアのアプリケーションでは、同じキーワードを含むイメージのインデックスに基づいて画像検索を実行できます。メディアやエンターテインメントのアプリケーションでは、画面上の広告、ニュース、スポーツの得点、字幕などのテキストに基づいてビデオを分類できます。また、セキュリティと安全のアプリケーションでは、交通監視カメラで捉えたイメージのナンバープレート番号に基づいて車を識別できます。

「ビジュアル駆動型のプラットフォームである Pinterest では、イメージの速度と画質が極めて重要ですが、これらのイメージに付随するテキストも同じように重要です。テキストは、当社の 2 億を超えるアクティブユーザーに実際に Pin するための背景情報を提供します。Amazon Rekognition の『イメージ内のテキスト』を使うことで、大量のイメージに取り込まれたリッチテキストが抽出しやすくなり、Amazon S3 に保存された何百万という Pin のレイテンシーを低く抑えることができます。これからも AWS とのパートナーシップを深め、Pinner に高品質で高速なサービスを提供し、Pinterest のビジネスを成長させていくつもりです。」- Vanja Josifovski、CTO、Pinterest

「プロの写真家が SmugMug を使用して共有したり販売したりする写真に、マラソン大会のゼッケン番号などの数字が含まれていることがあります。Amazon Rekognition の『イメージ内のテキスト』を使用すると、大量のゼッケン番号をプログラムで抽出できるため、これらの大会で写真家が撮った写真をすばやく簡単に共有したり収益化したりできるようになります。」 - Don MacAskill、Co-founder、CEO & Chief Geek at SmugMug
 

顔の検索と検出: Amazon Rekognition では、何千万という顔のコレクションに対してリアルタイムの顔検索ができるようになりました。これにより、検索のレイテンシーが以前よりも 5〜10 分の 1 に短縮されると共に、コレクションに保存できる顔の数が 10〜20 倍に増えます。

セキュリティと安全のアプリケーションでは、ほぼリアルタイムで何百万という顔のコレクションから目当ての人物を識別できます。これは、迅速で的確な犯罪防止のユースケースなどに役立ちます。ワシントン郡保安官オフィスは、オレゴン市民からの 911 番緊急通報に対するファーストレスポンダーです。このオフィスでは、全国の市警に対して犯罪防止のサポートも提供しています。これまでに Amazon Rekognition を使用して容疑者の識別所要時間を 2〜3 日から数分に短縮しました。

「この改善により、現場の警察官はほぼリアルタイムで検索の結果を得られます。必要な情報を取得してすばやく対応できます。現場では、数秒の差が人命救助の分かれ目になることがあります。」Chris Adzima、上級インフォメーションシステムアナリスト、ワシントン郡保安官オフィス

さらに、本日より、1 つのイメージに含まれている多数の顔から最大 100 (以前は 15) までを検出、分析、インデックスできるようになりました。この機能強化により、グループ写真、混雑したイベントや公共の場所 (空港やデパートなど) の写真で、すべての顔の人口統計データを正確にキャプチャしてセンチメントを分析できます。
 

イメージ内のテキスト、顔検索、および顔検出の使用を開始するには、最新の SDK をダウンロードしてください。または、単に Amazon Rekognition コンソールにログインし、用意されているサンプルイメージまたは自分のイメージを使用して、この機能をお試しください。詳細については、Amazon Rekognition のドキュメントでイメージ内のテキスト、顔検出、および顔検索を参照してください。