Logo di Careem

Careem migliora la prevenzione delle frodi grazie ad AWS Machine Learning

2021

Careem, con sede a Dubai, è diventata la prima azienda unicorno del Medio Oriente quando è stata acquisita da Uber per 3,1 miliardi di dollari nel 2019. Pioniera dell'economia del ride-hailing nella regione, Careem sta espandendo i suoi servizi per includere il trasporto di massa, le consegne e i pagamenti come super app quotidiana.

Ma le sue dimensioni e la sua popolarità, con circa 50 milioni di account clienti, l'hanno resa anche un ottimo bersaglio per i truffatori che cercano costantemente nuovi escamotage da sfruttare e modi diversi per dirottare account autentici.

Careem aveva bisogno di un modo per rilevare e fermare le perdite dovute a frodi che stavano danneggiando sia il fatturato che la reputazione del brand.

Si è rivolta ad Amazon Web Services (AWS) e ora sta contrastando il fenomeno utilizzando l'analisi e il machine learning per identificare e bloccare automaticamente i truffatori prima che venga commesso qualsiasi reato.

Distribuzione Careem
kr_quotemark

Amazon Neptune è completamente gestito, il che è un grande vantaggio per noi in termini di personale da impiegare in questo progetto e di costi potenziali di infrastruttura e manutenzione."

Kevin O'Brien
Data scientist senior presso Careem

Quando i truffatori attaccano

Careem rileva un'ampia varietà di frodi e i criminali trovano sempre nuove scappatoie per aggirare le misure specifiche messe in atto per contrastare i modelli di frode esistenti rilevati.

In passato, affrontare questi diversi tipi di frode era come giocare al gatto e topo. Careem doveva creare regole o modelli di machine learning per ogni tipo specifico di frode. Ma ciò presentava due problemi.

In primo luogo, permetteva a Careem di identificare e bloccare un account solo dopo che la frode era stata commessa e rilevata: ma a quel punto i soldi erano già andati persi.

In secondo luogo, i truffatori erano in grado di individuare rapidamente quando Careem aveva scoperto come rilevare quel tipo di frode e andavano avanti, trovando una nuova falla.

Un modo più intelligente

Era chiaro che Careem aveva bisogno di un modo più intelligente e veloce per rilevare gli account fraudolenti e fermare le frodi prima che fossero commesse.

"Invece di creare continuamente strumenti molto specifici per rilevare casi d'uso di frode molto specifici, volevamo creare un progetto che fosse quasi un meccanismo di rilevamento generalizzato per tutti gli utenti, indipendentemente dal tipo di falla trovata o dal tipo di attacco tentato", afferma Kevin O'Brien, senior data scientist di Careem.

Careem ha optato per un database a grafo per rilevare modelli potenzialmente fraudolenti in tempo reale attraverso l'attività degli utenti e degli account e ha valutato diversi dei principali fornitori sul mercato. 

Ha scelto AWS e le funzionalità automatizzate di analisi e monitoraggio in tempo reale di Amazon Neptune, in parte perché è un servizio gestito. 

"Amazon Neptune è completamente gestito, il che è un grande vantaggio per noi in termini di personale da impiegare in questo progetto e di costi potenziali di infrastruttura e manutenzione", dice O'Brien. "Invece, è tutto completamente gestito da AWS." 

Careem utilizzava già AWS per tutte le sue operazioni di cloud computing e data warehouse, quindi ha deciso di rimanere nello stesso ambiente per il suo progetto di prevenzione delle frodi. 

Careem preferiva anche il linguaggio di interrogazione Gremlin che supporta Amazon Neptune rispetto ai linguaggi di query come Cypher utilizzati da altri provider di database a grafo. Gremlin consente agli sviluppatori di scrivere query in una serie di linguaggi di programmazione, tra cui Groovy, Java e Python.

Rilevamento dei modelli concentrandosi sull'identità

Per migliorare la sua capacità di rilevamento delle frodi utilizzando Amazon Neptune, Careem ha iniziato a concentrarsi sull'identità degli utenti oltre a impegnarsi per affrontare tipi specifici di frode man mano che si presentavano.

Il database a grafo Amazon Neptune consente a Careem di stabilire connessioni tra diversi utenti e punti dati e di identificare modelli che potrebbero indicare attività fraudolente.

La prima versione del progetto di prevenzione delle frodi è stata lanciata nell'ottobre 2020 utilizzando i dati storici degli utenti risalenti al 2012 provenienti da fonti interne di Careem, come il suo data warehouse. Questi dati vengono estratti, trasformati e quindi formattati in file CSV su Amazon Simple Storage Service (Amazon S3) prima di essere caricati su Amazon Neptune. Questi dati storici vengono aggiunti in tempo reale man mano che gli utenti eseguono nuove azioni, come l'accesso da un nuovo dispositivo, l'aggiunta di una nuova carta di credito, il cambio numero di telefono o apportare una modifica al profilo. In media, i dati vengono aggiunti o aggiornati nel grafo di Amazon Neptune più di 100.000 volte al giorno.

Questo crea un cluster di dati collegati a ciascun utente, che vengono analizzati utilizzando un semplice motore di analisi algoritmico, creato da Careem utilizzando Python, che si trova su Amazon Neptune. 

Quando un account viene segnalato come potenzialmente fraudolento, viene bloccato automaticamente se dai dati risulta che si tratta di un account storicamente non affidabile o segnalato per una revisione manuale se si tratta di un account affidabile o ad alto valore, come quello di un cliente aziendale.

Ridurre le perdite con una maggiore precisione

Careem ha bloccato decine di migliaia di account utente fraudolenti dall'implementazione della prima fase del progetto nell'ottobre 2020 e i risultati sono impressionanti: circa il 90% degli utenti bloccati automaticamente dal sistema era stato bloccato correttamente. Ciò significa che Careem sta bloccando questi account falsi prima che venga commessa qualsiasi frode, il che aiuta a ridurre le perdite.

Dopo il successo di questa prima fase del progetto, Careem sta ora collaborando con AWS per una versione aggiornata che migliorerà ulteriormente l'accuratezza utilizzando la funzionalità di machine learning di Amazon Neptune ML.

Utilizzando circa 10 volte più dati storici, Careem sarà in grado di applicare il deep learning avanzato anziché un approccio basato su semplici regole e addestrare il sistema in modo che possa imparare a identificare come appare un utente fraudolento sul database a grafo. Ciò consentirà un recupero notevolmente migliore, dove il sistema sarà in grado di rilevare correttamente più account fraudolenti tra tutti gli utenti analizzati, migliorando al contempo l'accuratezza della previsione delle frodi ben oltre il 90%.

"Siamo molto fiduciosi che questa seconda versione della nostra soluzione migliorerà le nostre attuali capacità di prevenzione delle frodi", afferma O'Brien. "E questo è un altro ottimo motivo per cui abbiamo scelto Amazon Neptune."


Informazioni su Careem

Careem, con sede a Dubai, è pioniera dell'economia del ride-hailing e ora sta espandendo i suoi servizi per includere il trasporto di massa, le consegne e i pagamenti. Fondata nel 2012, Careem opera in oltre 100 città in 14 paesi del Medio Oriente, dell'Africa e dell'Asia meridionale. È stata acquisita da Uber per 3,1 miliardi di dollari nel 2019.

Vantaggi di AWS

  • Sicurezza e conformità
  • Agilità e prestazioni
  • Disponibilità
  • Innovazione

Servizi AWS utilizzati

Amazon Neptune

Amazon Neptune è il servizio di database a grafo rapido, affidabile e completamente gestito che semplifica la creazione e l'esecuzione di applicazioni che funzionano con set di dati altamente connessi.

Ulteriori informazioni »

Amazon Redshift

Con Redshift è possibile eseguire query e combinare esabyte di dati strutturati e semi-strutturati nel data warehouse, database operativo e data lake utilizzando SQL standard.

Ulteriori informazioni »

Amazon S3

Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.

Ulteriori informazioni »

Amazon SageMaker

Amazon SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML.

Ulteriori informazioni »


Inizia subito

Ulteriori informazioni su Amazon Neptune. Un database a grafo veloce e affidabile progettato per il cloud.