Careem ロゴ

Careem が AWS の機械学習で不正防止を強化

2021 年

ドバイを拠点とする Careem は、2019 年に Uber が 31 億ドルで買収し、中東初のユニコーン企業となりました。この地域の配車経済のパイオニアである Careem は、現在、日常的に利用できるスーパーアプリとして、大量輸送、配送、支払いを含めたサービスを拡大しています。

しかし、その規模と人気 (約 5,000 万の顧客アカウントがある) のため、悪用のための新しい抜け穴や、本物のアカウントを乗っ取るさまざまな方法を常に探している不正行為者からの、格好の標的にもなっています。

Careem は、収益とブランドの評判の両方を損なう不正行為による損失を検出して阻止する方法を必要としていました。

そこで、同社は Amazon Web Services (AWS) に目を向け、分析と機械学習を使用して、犯罪が行われる前に不正行為者を自動的に特定してブロックすることで反撃しています。

Careem の配信
kr_quotemark

フルマネージドの Amazon Neptune は、このプロジェクトに必要な人員の数、そしてインフラストラクチャやメンテナンスの潜在的なコストの面で、私たちの大きな強みとなっています」

Kevin O’Brien
Careem、シニアデータサイエンティスト

不正行為者が攻撃するとき

Careem は多種多様な不正行為を目の当たりにしており、犯罪者は検出された既存の不正パターンに対抗するために実施されている特定の対策を回避するために、常に新しい抜け穴を見つけています。

これまで、こうしたさまざまな種類の不正行為への取り組みは、いたちごっことなっていました。Careem は、特定の種類の不正行為ごとにルールや機械学習モデルを作成する必要がありました。しかし、これは 2 つの側面で問題がありました。

まず、Careem がアカウントを特定してブロックできるのは、不正行為が行われて検出された後であり、その時には既にお金は盗まれていました。

次に、不正行為者は、Careem がその種の不正行為を検出する方法を考え出したことをすぐに特定でき、着々と悪用のための新しい抜け穴を見つけることができたのです。

よりスマートな方法

Careem が、不正なアカウントを検出し、不正行為を未然に防ぐための、よりスマートで迅速な方法が必要なことは明らかでした。

「非常に特殊な不正行為のユースケースを検出するための非常に特殊なツールを継続的に作成するのではなく、彼らが発見した抜け穴の種類や実施しようとした攻撃のタイプに関係なく、すべてのユーザーにほぼ包括的な検出メカニズムを提供するプロジェクトを構築したかったのです」と、Careem のシニアデータサイエンティストである Kevin O'Brien 氏は述べています。

Careem は、ユーザーとアカウントのアクティビティ全体にわたって不正である可能性があるパターンをリアルタイムで検出する方法としてグラフデータベースを選択し、市場の主要なプロバイダーのいくつかを評価しました。 

同社は、AWS と Amazon Neptune の自動リアルタイム分析とモニタリング機能を選択しました。その理由の 1 つに、マネージド型サービスがありました。 

「フルマネージドの Amazon Neptune は、このプロジェクトに取り組む人員の数、そしてインフラストラクチャやメンテナンスの潜在的なコストの面で、私たちの大きな強みとなっています」と、O'Brien 氏は言います。「むしろ、すべてが AWS によって完全に管理されています」。 

Careem はすでに AWS をすべてのクラウドコンピューティングとデータウェアハウスの運用に使用していたため、不正防止プロジェクトでも同じ環境を適用することにしました。 

また、Careem は、他のグラフデータベースプロバイダーが使用する Cypher などのクエリ言語よりも、Amazon Neptune をサポートする Gremlin クエリ言語を選択しました。Gremlin を使用すると、開発者は Groovy、Java、Python などのさまざまなプログラミング言語でクエリを記述できます。

身元に焦点を当てたパターン検出

Amazon Neptune を使用して不正行為の検出機能を向上させるために、Careem は特定の種類の不正行為が発生したときに対処する取り組みに加えて、ユーザーの身元にも注目し始めました。

Amazon Neptune グラフデータベースにより、Careem はさまざまなユーザーとデータポイントを接続し、不正行為を示す可能性のあるパターンを特定できます。

不正防止プロジェクトの最初のバージョンは、データウェアハウスなどの Careem の社内ソースからの 2012 年にさかのぼる過去のユーザーデータを使用して、2020 年 10 月に稼働を開始しました。このデータは、抽出、変換されてから、Amazon Neptune にアップロードされる前に Amazon Simple Storage Service (Amazon S3) で CSV ファイルにフォーマットされます。この履歴データは、新しいデバイスを使用したログイン、新しいクレジットカードの追加、電話番号の変更、プロファイルの変更など、ユーザーが新しいアクションを実行すると、リアルタイムで追加されます。Amazon Neptune グラフのデータは、平均して 1 日に 10 万回以上追加または更新されます。

これにより、各ユーザーに接続するデータのクラスターが作成され、Careem が Python を使用して構築したシンプルなアルゴリズム分析エンジンを使用して分析が行われます。このエンジンは、Amazon Neptune 上にあります。 

アカウントに不正の可能性があるとしてフラグが立てられた場合、そのアカウントが過去に信頼できないアカウントであることがデータで示されている場合は自動的にブロックされ、信頼できるアカウントまたは法人の顧客などの価値の高いアカウントである場合は手動審査のフラグが立てられます。

精度の向上による損失の削減

Careem は、2020 年 10 月にプロジェクトの第 1 フェーズを実施して以来、数万件もの不正ユーザーアカウントをブロックしてきましたが、その結果は驚くべきものでした。システムによるユーザーの自動ブロックの約 90% が正しい判断でした。つまり、Careem は不正行為が行われる前にこれらの偽アカウントをブロックしていることを意味し、損失を減らすのに役立っています。

プロジェクトのこの第 1 フェーズが成功した後、Careem は現在、Amazon Neptune ML の機械学習機能を使用して精度をさらに向上させる更新バージョンを AWS と協力して開発しています。

Careem は、約 10 倍多くの履歴データを使用することで、単純なルールベースのアプローチの代わりに高度な深層学習を適用し、グラフデータベース上で不正ユーザーがどのように見えるかの判断を学習できるようにシステムをトレーニングできるようになります。この結果、リコールが大幅に改善され、システムが分析したすべてのユーザーからより多くの不正アカウントを正しく検出でき、不正予測の精度は 90% をはるかに上回るようになります。

「このソリューションの第 2 バージョンにより、現在の不正防止機能が向上すると確信しています」と、O'Brien 氏は言います。「そして、これが Amazon Neptune を選んだもう 1 つの大きな理由です」。


Careem について

ドバイを拠点とする Careem は、配車経済のパイオニアであり、現在、大量輸送、配送、支払いを含むようにサービスを拡大しています。2012 年に設立された Careem は、中東、アフリカ、南アジアの 14 か国 100 以上の都市で事業を展開しています。2019 年に Uber によって 31 億ドルで買収されました。

AWS の利点

  • セキュリティとコンプライアンス
  • 俊敏性とパフォーマンス
  • 可用性
  • イノベーション

利用している AWS のサービス

Amazon Neptune

Amazon Neptune は高速かつ信頼性の高いフルマネージドのグラフデータベースサービスです。このサービスは、高度に接続されたデータセットと連携するアプリケーションの構築と実行を容易にします。

詳細 »

Amazon Redshift

Redshift では、標準的な SQL を使用することで、データウェアハウス、運用データベース、およびデータレイクにあるエクサバイト規模の構造化データと半構造化データに対するクエリの実行や、これらのデータの結合が可能になります。

詳細 »

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。

詳細はこちら »

Amazon SageMaker

Amazon SageMaker は、機械学習専用に構築された幅広い一連の機能をまとめて提供することにより、データサイエンティストとデベロッパーが高品質の機械学習 (ML) モデルを迅速に準備、構築、トレーニング、およびデプロイするのを支援します。

詳細 »


開始方法

Amazon Neptune の詳細はこちら。クラウド向けに構築された高速で信頼性の高いグラフデータベース。