Amazon Web Services ブログ

REA Group は、Amazon Rekognition を使用していかに画像コンプライアンスの自動化を実現したか



Amazon Rekognition は、画像や動画内のオブジェクト、人物、文字、場面および活動を識別し、さらに不適切な内容を検知する、機械学習 (ML) ベースの画像および映像分析サービスです。Amazon Rekognition のテキスト検出機能は、画像や動画のテキストコンテンツを認識し、抽出することを可能にします。たとえば画像共有アプリやソーシャルメディアアプリでこの機能を使用すると、テキスト検索により、同じキーワードでインデックス化された画像を表示させることができます。メディアアプリやエンターテインメントアプリの場合、広告、ニュース、スポーツのスコア、字幕など、画面上のテキストに基づいて動画をカタログ化できます。

次のスクリーンショットは、画像内テキスト の抽出例を示しています。

この記事では、REA Group が DetectText API を通じてAmazon Rekognition Text in Image 機能を使用することで、不動産リスティングにいかに自動画像コンプライアンスソリューションを導入したかについて説明します。

REA Group について

REA Group は、不動産向けデジタル広告を専門とする多国籍企業です。創業から 20 年以上を数える同社は、オーストラリア、マレーシア、香港、タイ、インドネシア、シンガポール、中国で事業を展開しています。REA Group は、アジアで iproperty.com.mysquarefoot.com.hkthinkofliving.com といった主要ポータルブランドを運営しているほか、シンガポールとインドネシアで不動産広告サイトを展開する 99 Group を傘下に収めています。さらに、インドの不動産広告サイトである Move, Inc や PropTiger の大株主でもあります。REA Group のウェブサイトは、消費者に向けた不動産の売買および賃貸サービスに加え、最新の不動産ニュース、改装のヒント、ライフスタイル情報などを提供しており、1 日あたりの訪問者数は何百万人にも上ります。

画像コンプライアンスの課題

REA Group が提供する検索ベースのポータルでは、消費者は売主がアップロードした販売中の不動産の画像を検索し、幅広い選択肢の中から選び出すことができます。REA チームは、アップロードされた画像がしばしば利用規約に違反していることに気づきました。たとえば、売主の商標や連絡先の詳細が含まれた画像がアップロードされていることがあり、そのことがリード帰属問題を引き起こしていました。そこで同社は、画像の中に許可されないコンテンツがないかを人の目で確認するためのチームを立ち上げましたが、日々膨大な量の画像がアップロードされる中、審査プロセスが増えたことで不動産リスティング広告が掲載されるまでに数日の遅れが出るようになってしまいました。

画像コンプライアンスソリューション

REA チームは、規約に準拠していない画像を自動的に検出し、売主に通知する画像コンプライアンスシステムを開発しました。当初は、Amazon Elastic Compute Cloud (Amazon EC2) 上で、独自に商標および連絡先情報検出 ML モデルをトレーニングしていました。しかしこれらのモデルを使用すると、特に連絡先情報の検出で多数の偽陽性が検出されました。モデルの精度を上げるには、モデルのトレーニングや最適化を含め、さらに多くの手を加える必要がありました。プロジェクトの目標とスケジュールを満たすため、チームは導入しやすく、かつビジネスに必要な正確性を実現できるソリューションを求めていました。

こうした目標を念頭に、チームは検出精度を高めて且つ偽陽性を減らすため、Amazon Rekognition Text in Image 機能を利用して、既存の機械学習モデルの強化とワークフローの見直しを行うことを決定しました。REA チームは、独自のモデルや Amazon Rekognition から得たさまざまな予測を計算に入れ、自動的な意思決定を可能にしました。

さらに、AWS Lambda を使用したイベント駆動のアーキテクチャを適用して、商標および連絡先情報モデル推論エンジンをホストすることで、推論インフラストラクチャの運営コストを最適化しました。このアプローチは、インフラストラクチャリソース利用の効率性を高めただけでなく、ビジネス目標を満たしながらのコスト削減にも貢献しました。

仕組み

このソリューションは、下図のアーキテクチャが示すとおり、サーバーレススタックとして構築されており、Amazon Simple Storage Service (Amazon S3) の上に画像アップロード API である Amazon API Gateway が配置されており、Lambda を使用したイベント駆動のワークフローがトリガーされることで一連の機械学習モデルとビジネスルールが実行され、自動的な意思決定が実現します。

イベント駆動のワークフローの内容は次のとおりです。

  1. 売主が API Gateway を通じて画像付き不動産リスティング広告をポータルに送信します。
  2. 画像が Amazon S3 にアップロードされると、Amazon S3 イベントがトリガーされます。
  3. Amazon S3 オブジェクトの関連メタデータを含んだイベントが、分散キュー (Amazon Simple Queue Service (Amazon SQS) ) に発行されます。
  4. Amazon SQS と Lambda の組み合わせを使用して、Lambda は新しいイベントが利用可能となるまでキューをポーリングします。これにより Lambda 関数が呼び出されます。Lambda は、Amazon SQS に発行されるイベントが増えると、自動的にさらなる関数を呼び出します。
  5. 関数が呼び出されると、関数内の画像レビュービジネスロジックが実行され、商標および連絡先情報モデルのほか、Amazon Rekognition によってコンプライアンス違反が検出されます。
  6. モデルの出力はビジネスルールに照らしてさらに処理され、エージェントに通知する、レビューチームにさらなる調査を委ねる、自動承認するといった次のステップが決定されます。

ビジネスへの効果

「会社が成長するにつれ、効率性を高めつつ規模を最適化することが重要な要素となってきたため、私たちは、チームをスリムに保ちながらお客様により良いサービスを提供するにはどうすればよいか、知恵を出し合いました。」と、データサイエンスおよびエンジニアリング部門統括者のモハンマド・アラウディン氏は述べています。「AWS Lambda と Amazon Rekognition を通じた AWS の機械学習により、当社は広告掲載までの時間とコストを削減しながら、コンプライアンスの基準を満たし、かつ高品質なリスティング広告をプラットフォームに増やすことができました。さらに、計画したスケジュールでプロジェクトを完了できただけでなく、偽陽性が 56 パーセント以上も減りました。」

まとめ

Amazon Rekognition コンソール上で、御社のビジネスに適した画像を使用して Amazon Rekognition テキスト検出機能をテストできます。Amazon Rekognition テキスト検出 API の詳細については、Amazon Rekognition のドキュメントをご参照ください。


著者について

Fabian Tan は、アマゾン ウェブ サービスのシニアソリューションアーキテクトです。データベース、データ分析、機械学習に熱い情熱を傾けており、マレーシアの開発者コミュニティと密接に関わりながらイノベーションの手助けをしています。余暇には、家族とのキャンプ、読書、スポーツを楽しんでいます。