Careem 利用 AWS 機器學習改善詐騙防護
2021 年
總部位於杜拜的 Careem 在 2019 年以 31 億 USD 被 Uber 收購,成為中東排名第一的獨角獸企業。Careem 是該區域叫車經濟的先驅,目前正在擴展其服務,以在其日常超級應用程式中納入大眾運輸、送貨和付款服務。
但是,該公司的規模和普及性 (擁有約 5000 萬個客戶帳戶) 也使其成為不斷尋找新漏洞以及不同方法劫持真實帳戶的詐騙者的主要目標。
Careem 需要採用一種方法來偵測並阻止損害其收入和品牌聲譽的詐騙損失。
該公司轉向 Amazon Web Services (AWS),目前使用分析和機器學習,在任何犯罪行為發生之前自動識別並封鎖詐騙者的活動。
Amazon Neptune 是完全受管的服務,在需要多少人參與此專案以及基礎設施和維護的潛在成本方面,該服務提供巨大的優勢。」
Kevin O’Brien
Careem 資深資料科學家
當詐騙者攻擊時
Careem 見識過各種不同類型的詐騙,並且罪犯始終會尋找新的漏洞,以繞過公司為打擊現有已偵測詐欺模式而採取的具體措施。
在過去,對抗這些不同類型的詐騙是一場永無止境的貓捉老鼠遊戲。Careem 曾經必須為每種特定類型的詐騙建立規則或機器學習模型。但是,這種方法存在兩個層面上的問題。
首先,它僅可讓 Careem 在詐騙已發生並得到偵測後識別和封鎖帳戶 — 但此時資金已損失。
其次,詐騙者能夠快速注意到 Careem 已經研究如何偵測此類詐騙,他們會繼續前進,找到新的漏洞加以利用。
更智慧的方法
很明顯,Careem 需要採用更智慧、更快速的方法來偵測詐騙帳戶並在詐騙活動發生之前及時阻止。
Careem 資深資料科學家 Kevin O'Brien 表示:「我們不會持續建立非常具體的工具來偵測特定的詐騙使用案例,而是想要建立針對所有使用者進行全面偵測的專案,而不論這些使用者發現何種類型的漏洞或嘗試進行何種類型的攻擊。」
Careem 選擇採用圖形資料庫作為在使用者和帳戶活動中即時偵測潛在詐騙模式的方法,並且評估了市場上的幾家主要供應商。
公司選擇 AWS 以及 Amazon Neptune 的自動化即時分析和監控功能,部分原因在於其是一項受管服務。
O'Brien 表示:「Amazon Neptune 是完全受管的服務,在需要多少人參與此專案以及基礎設施和維護的潛在成本方面,該服務提供巨大的優勢。」「上述所有任務都由 AWS 完全管理。」
Careem 已經使用 AWS 執行其所有雲端運算和資料倉儲操作,因此選擇為其詐騙防護專案採用相同的環境。
Careem 還偏好支援 Amazon Neptune 的 Gremlin 查詢語言,而不是其他圖形資料庫供應商使用的查詢語言 (例如 Cypher)。藉助 Gremlin,開發人員可使用各種程式設計語言編寫查詢,包括 Groovy、Java 和 Python。
透過專注於身分來偵測模式
為了提高其使用 Amazon Neptune 的詐騙偵測能力,除了努力解決出現的特定類型詐騙行為外,Careem 也開始專注於使用者的身分。
Amazon Neptune 圖形資料庫可讓 Careem 在不同使用者和資料點之間釐清關聯性,並識別可能代表詐騙活動的模式。
此詐騙防護專案的第一個版本在 2020 年 10 月上線,當時使用可追溯到 2012 年且來自 Careem 內部來源 (例如其資料倉儲) 的歷史使用者資料。在 Amazon Simple Storage Service (Amazon S3) 上擷取、轉換此資料並將其格式化為 CSV 檔案,然後再上傳到 Amazon Neptune。當使用者執行新動作 (例如使用新裝置登入、新增信用卡、變更電話號碼或變更設定檔) 時,會即時新增歷史資料。平均而言,每天會在 Amazon Neptune 圖表中新增或更新資料超過 100,000 次。
這會建立連線至每個使用者的資料叢集,並使用簡單的演算法分析引擎對其進行分析,該引擎由 Careem 使用 Python 建置並位於 Amazon Neptune 之上。
當帳戶被標記為潛在詐騙帳戶時,如果資料顯示其過去是不可信賴的帳戶,則會自動將其封鎖;或者如果其是值得信賴或高價值的帳戶 (例如企業客戶),則會被標記以手動審查。
透過提高準確性減少損失
自 2020 年 10 月實作該專案的第一階段以來,Careem 已封鎖數十萬個欺詐使用者帳戶,結果令人印象深刻 — 系統自動封鎖的使用者中約有 90% 是正確的決定。這意味著 Careem 在任何詐騙活動發生之前封鎖這些虛假帳戶,從而有助於減少損失。
在該專案的第一階段取得成功之後,Careem 目前正與 AWS 合作開發更新版本,該版本將透過使用 Amazon Neptune ML 中的機器學習功能進一步提高準確性。
使用大約 10 倍的歷史資料,Careem 將能夠套用進階深度學習而非以規則為基礎的簡單方法,同時訓練系統,使其學習識別詐騙使用者在圖形資料庫中的模樣。這將大幅降低召回率,即系統能夠從系統分析的所有使用者中正確偵測出更多詐騙帳戶,同時將詐騙預測準確性提高至超過 90%。
O'Brien 表示:「我們非常相信此第二個版本的解決方案將改善自身目前的詐騙防護能力。這是我們選擇 Amazon Neptune 的另一個重要原因。」
Careem 簡介
總部位於杜拜的 Careem 是叫車經濟的先驅,目前正在擴展其服務以納入大眾運輸、送貨和付款服務。Careem 成立於 2012 年,在中東、非洲和南亞 14 個國家/地區的 100 多個城市開展營運。公司於 2019 年被 Uber 以 3.1 億 USD 收購。
AWS 的優勢
- 安全與合規
- 敏捷性與效能
- 可用性
- 創新
使用的 AWS 服務
Amazon Neptune
Amazon Neptune 是快速、可靠的全受管圖形資料庫服務,可讓您輕鬆建置及執行搭配高度連線資料庫運作的應用程式。
Amazon Redshift
使用 Redshift,您可以在資料倉儲、操作型資料庫及使用標準 SQL 的資料湖中查詢並組合 EB 級的結構化和半結構化資料。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
Amazon SageMaker
Amazon SageMaker 透過整合專門為機器學習 (ML) 建置的一組廣泛的功能,協助資料科學家和開發人員快速準備、建置、訓練和部署高品質的機器學習 (ML) 模型。
開始使用
進一步了解 Amazon Neptune。快速可靠的圖形資料庫,專為雲端設計。