Le Blog Amazon Web Services

AXA : L’Intelligence Artificielle au service de la lutte contre la fraude à l’assurance

La fraude est une préoccupation constante dans le secteur de l’assurance. En 2018, elle représentait un manque à gagner de 500 millions d’euros assurance dommages en France selon l’Agence pour la lutte contre la fraude à l’assurance (Alfa), une perte qui se répercute sur le montant des primes d’assurance. En période de crise, on observe une recrudescence des déclarations frauduleuses. C’était le cas pendant la crise économique de 2008 et on s’attend au même phénomène avec la crise de la COVID. AXA a développé Sherlock, un module de lutte contre la fraude à la déclaration de sinistres, basé sur les technologies d’intelligence artificielle de AWS. Cette solution, présentée par AXA et AWS lors de l’évènement « Big Data et AI World Paris », démontre que les technologies d’intelligence artificielle peuvent significativement améliorer la détection de fraude.

 

 Associer l’expérience des spécialistes de la fraude à l’expertise des data-scientists

La fraude évolue rapidement et de nouveaux types de fraudes apparaissent en permanence. AXA a démarré il y a 4 ans le développement de Sherlock, un module de lutte contre la fraude à la déclaration de sinistres, avec une approche en deux temps. AXA s’est d’abord appuyé, dans une logique « règles métiers », sur son équipe de spécialistes de la fraude pour concevoir un moteur de règles capable de comprendre les schémas de données (patterns) dans les déclarations de sinistres. C’est cette même équipe qui effectue les investigations suite aux détections de fraude. Pour compléter les analyses réalisées par les règles métiers, une équipe de data-scientists a ensuite développé grâce à Amazon SageMaker des modèles prédictifs basés sur des algorithmes de machine learning pour identifier les cas de fraude.

De cette expérience croisée, AXA a développé une solution interne, utilisée aujourd’hui dans plusieurs pays, qui permet aux équipes métiers d’identifier les modèles de fraude sur toute l’activité IARD. Cette complémentarité entre moteur de règles et modèles de machine learning augmente le taux de précision de la solution.

Les fraudes s’appuient sur des « réseaux » entre plusieurs tiers. Ces relations sont modélisées sous forme de graphes, dans le module Spark GraphX contenu dans Amazon EMR, pour identifier les éventuels patterns de fraude. Le machine learning aide à réduire ce taux. L’architecture de Sherlock permet à la fois de partager et de réutiliser les règles d’analyse de « patterns » de fraude entre plusieurs pays (une technique de fraude pouvant se propager rapidement d’un pays à l’autre) et de garantir des environnements dédiés et sécurisés pour chaque pays.

L’importance des données dans la précision des modèles de machine learning

Avant de démarrer un projet de machine learning, il est primordial de commencer à collecter les données et de constituer un vaste lac de données – basé pour Sherlock sur Amazon S3 et la base PostgreSQL – qui alimentera les modèles. Dans le respect de la RGPD, AXA a mis en œuvre des procédés d’anonymisation pour le traitement des données.  Aux classiques formulaires de déclaration de sinistres s’ajoutent des documents, des images et des photos. Les assureurs utilisent également les méta données des photos pour vérifier les lieux et les horaires mentionnés. AXA recourt également à des données externes structurées ou non structurées (Internet, IoT, images et documents). Dans le cadre de l’investigation, les spécialistes d’AXA peuvent vérifier si une image ou un document est frauduleux et des algorithmes de Computer Vision et de Natural Language Processing élargissent le champ d’investigation. Les résultats des investigations réinjectés par la suite dans les modèles de machine learning concourent à l’amélioration de leur précision. Pour que cette précision perdure, les modèles de machine learning doivent tenir compte du phénomène de « dérive conceptuelle » (data drift). L’apprentissage des modèles utilise des jeux de données qui correspondent à un contexte donné. Une situation particulière, comme la crise sanitaire de 2020, peut considérablement modifier le contexte et dégrader progressivement la précision des modèles. Il est donc nécessaire d’en tenir compte avec des jeux d’apprentissage mis à jour.

Préserver la relation de confiance

La confiance qui lie l’assurance à l’assuré est une valeur primordiale. C’est pourquoi une fraude n’est validée qu’après une investigation rigoureuse menée par les spécialistes. La décision finale incombe à une personne d’AXA et non pas à l’Intelligence artificielle.

Les algorithmes de machine learning interviennent de plus en plus souvent dans les prises de décisions des entreprises, tous secteurs confondus. En cas de litiges, les entreprises devront pouvoir expliquer ces décisions ou ces résultats fournis par ces algorithmes. De nouvelles exigences réglementaires portant sur « l’explicabilité » des algorithmes verront sans doute le jour et il faut s’y préparer. Qui plus est, il faudra également être en mesure de vérifier que les modèles ne sont pas faussés par des biais. Aujourd’hui, des approches comme LIME (Local Interpretable Model-agnostic Explanation) ou SHAP (SHapley Additive exPlanations) facilitent l’interprétation des modèles.

Si toutes les entreprises ne disposent pas d’une équipe de data scientists aussi conséquente que celle d’AXA, nombreuses sont celles qui peuvent trouver dans le cloud des services pour les aider sur ces sujets. Par exemple, pour limiter les biais, elles peuvent utiliser Amazon SageMaker Clarify pour une plus grande visibilité sur les données et sur les modèles d’apprentissage. Amazon Fraud Detector fournit par ailleurs tout ce qui est nécessaire pour créer, déployer et gérer des modèles de détection des fraudes.

Sherlock utilise également une API pour détecter les tentatives de fraude en temps réel lors de la constitution du dossier. L’autoscaling ajuste en permanence de la puissance calcul avec la performance désirée. La mise en œuvre de la chaine de production (MLOps) a été facilitée par SageMaker et AXA envisage à présent d’adopter le serverless afin de réduire encore le temps de déploiement de la solution. Après s’être concentrée sur l’assurance dommages, AXA souhaite profiter de l’expérience acquise pour étendre sa solution A d’autres lignes de métier