Careem verbessert die Betrugsprävention mit AWS Machine Learning
2021
Careem mit Sitz in Dubai wurde das erste Einhorn im Nahen Osten, als es 2019 von Uber für 3,1 Milliarden US-Dollar übernommen wurde. Careem ist ein Pionier der Ride-Hailing-Wirtschaft in der Region und erweitert nun seine Dienstleistungen um Massentransporte, Lieferung und Zahlungen als alltägliche Super-App.
Aufgrund seiner Größe und Beliebtheit – Careem hat rund 50 Millionen Kundenkonten – ist es jedoch auch zu einem Hauptziel für Betrüger geworden, die ständig nach neuen Schlupflöchern suchen, die sie ausnutzen können, und nach verschiedenen Möglichkeiten, echte Konten zu kapern.
Careem benötigte eine Möglichkeit, Verluste durch Betrug, der sowohl dem Umsatz als auch dem Ruf der Marke schadete, zu erkennen und zu stoppen.
Das Unternehmen wandte sich an Amazon Web Services (AWS) und wehrt sich nun mithilfe von Analysen und maschinellem Lernen, um Betrüger automatisch zu identifizieren und zu blockieren, bevor ein Verbrechen begangen werden kann.
Amazon Neptune wird vollständig verwaltet, was für uns ein großer Vorteil in Bezug auf die Anzahl der Mitarbeiter, die an diesem Projekt arbeiten müssten, und die potenziellen Kosten für Infrastruktur und Wartung ist.“
Kevin O'Brien
Senior Data Scientist, Careem
Wenn Betrüger angreifen
Careem ist mit einer Vielzahl verschiedener Arten von Betrug konfrontiert, und Kriminelle finden immer neue Schlupflöcher, um die spezifischen Maßnahmen zu umgehen, die zur Bekämpfung der aufgedeckten Betrugsmuster ergriffen wurden.
In der Vergangenheit war die Bekämpfung dieser verschiedenen Arten von Betrug ein nie endendes Katz-und-Maus-Spiel. Careem musste früher Regeln oder Modelle für Machine Learning für jede spezifische Art von Betrug erstellen. Dies war jedoch auf zwei Ebenen problematisch.
Erstens konnte Careem ein Konto erst identifizieren und sperren, nachdem der Betrug begangen und entdeckt worden war – das Geld war bereits verloren.
Zweitens konnten Betrüger schnell erkennen, wann Careem herausgefunden hatte, wie diese Art von Betrug zu erkennen war, und sie machten einfach weiter und fanden ein neues Schlupfloch, das sie ausnutzen konnten.
Ein intelligenterer Weg
Es war klar, dass Careem eine intelligentere und schnellere Methode benötigte, um betrügerische Konten zu erkennen und Betrug zu stoppen, bevor er begangen wurde.
„Anstatt kontinuierlich sehr spezifische Tools zur Aufdeckung sehr spezifischer Betrugsfälle zu entwickeln, wollten wir ein Projekt realisieren, das fast einen generellen Erkennungsmechanismus für alle Benutzer darstellt, unabhängig davon, welche Art von Sicherheitslücke die Betrüger gefunden haben oder welche Art von Angriff sie versuchen“, sagt Kevin O'Brien, Senior Data Scientist bei Careem.
Careem entschied sich für eine Grafikdatenbank, um potenziell betrügerische Muster bei Benutzer- und Kontoaktivitäten in Echtzeit zu erkennen, und bewertete mehrere der wichtigsten Anbieter auf dem Markt.
Es entschied sich für AWS und die automatisierten Analyse- und Überwachungsfunktionen von Amazon Neptune in Echtzeit, auch weil es sich um einen verwalteten Service handelt.
„Amazon Neptune wird vollständig verwaltet, was für uns ein großer Vorteil ist, was die Anzahl der Mitarbeiter angeht, die an diesem Projekt arbeiten müssten, und die potenziellen Kosten für Infrastruktur und Wartung“, sagt O'Brien. „Stattdessen wird das alles vollständig von AWS verwaltet.“
Careem nutzte AWS bereits für seinen gesamten Cloud-Computing- und Data-Warehouse-Betrieb und entschied sich daher dafür, für sein Betrugspräventionsprojekt in derselben Umgebung zu bleiben.
Zudem bevorzugte Careem die Abfragesprache Gremlin, die Amazon Neptune unterstützt, anstelle von Abfragesprachen wie Cypher, die von anderen Graphdatenbankanbietern verwendet werden. Gremlin ermöglicht es Entwicklern, Abfragen in einer Reihe von Programmiersprachen zu schreiben, darunter Groovy, Java und Python.
Muster erkennen, indem man sich auf Identität konzentriert
Um die Funktionen zur Betrugserkennung mithilfe von Amazon Neptune zu verbessern, begann Careem, sich neben der Bekämpfung bestimmter Betrugsarten, sobald sie auftraten, auch auf die Identität der Nutzer zu konzentrieren.
Die Amazon-Neptune-Graph-Datenbank ermöglicht es Careem, Verbindungen zwischen verschiedenen Benutzern und Datenpunkten herzustellen und Muster zu identifizieren, die auf betrügerische Aktivitäten hinweisen könnten.
Die erste Version des Betrugspräventionsprojekts wurde im Oktober 2020 unter Verwendung historischer Benutzerdaten aus internen Quellen von Careem, wie dem Data Warehouse, aus dem Jahr 2012 in Betrieb genommen. Diese Daten werden extrahiert, transformiert und dann auf Amazon Simple Storage Service (Amazon S3) in CSV-Dateien formatiert, bevor sie auf Amazon Neptune hochgeladen werden. Diese historischen Daten werden in Echtzeit hinzugefügt, wenn Benutzer neue Aktionen ausführen, z. B. ein neues Gerät zum Anmelden verwenden, eine neue Kreditkarte hinzufügen, eine Telefonnummer ändern oder eine Profiländerung vornehmen. Im Durchschnitt werden dem Amazon-Neptune-Diagramm mehr als 100 000 Mal pro Tag Daten hinzugefügt oder aktualisiert.
Dadurch wird ein Cluster von Daten erstellt, die mit jedem Benutzer verbunden sind und mit einer einfachen algorithmischen Analyse-Engine analysiert werden, die von Careem mithilfe von Python erstellt wurde und auf Amazon Neptune basiert.
Wenn ein Konto als potenziell betrügerisch gekennzeichnet wird, wird es entweder automatisch gesperrt, wenn die Daten zeigen, dass es sich in der Vergangenheit um ein nicht vertrauenswürdiges Konto handelt, oder zur manuellen Überprüfung gekennzeichnet, wenn es sich um ein vertrauenswürdiges oder hochwertiges Konto handelt, z. B. das eines Firmenkunden.
Reduzierung von Verlusten mit verbesserter Genauigkeit
Careem hat seit der Implementierung der ersten Phase des Projekts im Oktober 2020 Zehntausende betrügerischer Benutzerkonten gesperrt, und die Ergebnisse sind beeindruckend – rund 90 Prozent der Benutzer, die das System automatisch gesperrt hat, waren richtige Entscheidungen. Das bedeutet, dass Careem diese gefälschten Konten sperrt, bevor Betrug begangen wird, was dazu beiträgt, Verluste zu reduzieren.
Nach dem Erfolg dieser ersten Phase des Projekts arbeitet Careem nun mit AWS an einer aktualisierten Version, die die Genauigkeit durch Nutzung der maschinellen Lernfunktion in Amazon Neptune ML weiter verbessern wird.
Careem nutzt etwa zehnmal mehr historische Daten und wird in der Lage sein, fortgeschrittenes Deep Learning anstelle eines einfachen regelbasierten Ansatzes anzuwenden und das System so zu trainieren, dass es lernen kann, zu erkennen, wie ein betrügerischer Benutzer in der Graph-Datenbank aussieht. Dies ermöglicht einen erheblich verbesserten Rückruf, bei dem das System in der Lage ist, mehr betrügerische Konten aller vom System analysierten Benutzer korrekt zu erkennen und gleichzeitig die Genauigkeit der Betrugsvorhersagen um weit über 90 Prozent zu verbessern.
„Wir sind sehr zuversichtlich, dass diese zweite Version unserer Lösung unsere derzeitigen Funktionen zur Betrugsprävention verbessern wird“, sagt O'Brien. „Und das ist ein weiterer guter Grund, warum wir uns für Amazon Neptune entschieden haben.“
Über Careem
Careem mit Sitz in Dubai ist ein Pionier der Ride-Hailing-Wirtschaft und erweitert nun seine Services um Angebote im öffentlichen Nahverkehr, Lieferung und Zahlungen. Careem wurde 2012 gegründet und ist in über 100 Städten in 14 Ländern des Nahen Ostens, Afrikas und Südasiens tätig. Es wurde 2019 von Uber für 3,1 Milliarden US-Dollar übernommen.
Mehrwerte durch AWS
- Sicherheit und Compliance
- Agilität und Leistung
- Verfügbarkeit
- Innovation
Genutzte AWS-Services
Amazon Neptune
Amazon Neptune ist ein schneller, zuverlässiger, vollständig verwalteter Graphdatenbank-Service, mit dem sich Anwendungen, die mit stark verknüpften Datensätzen arbeiten, ganz einfach entwickeln und ausführen lassen.
Amazon Redshift
Mit Redshift können Sie Exabyte an strukturierten und halbstrukturierten Daten in Ihrem Data Warehouse, in Ihrer Betriebsdatenbank und in Ihrem Data Lake mithilfe standardmäßiger SQL-Anweisungen abfragen und kombinieren.
Amazon S3
Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.
Amazon SageMaker
Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler bei der Vorbereitung, der Erstellung, dem Training und der Bereitstellung hochwertiger Machine Learning (ML)-Modelle durch eine breite Palette von speziell für ML entwickelten Funktionen.
Erste Schritte
Weitere Informationen zu Amazon Neptune Eine schnelle, zuverlässige Graph-Datenbank, entwickelt für die Cloud