Aller au contenu principal

Détection de la fraude : un sujet ancien revisité par le Big Data

Le déploiement massif dans le monde entier de compteurs dit « intelligents » offre de nouvelles opportunités et entraîne une refonte de nombreux usages des distributeurs d’électricité, de gaz ou d’eau.

Si les matériels communicants s’inscrivent en premier lieu dans un contexte d’intégration des productions intermittentes et délocalisées ainsi que de maitrise d’énergie, ils pourraient également révolutionner l’approche des distributeurs face à la lutte anti-fraude. En effet, la disparition des relevés physiques de consommation avec les compteurs intelligents empêche par la même occasion les contrôles des installations. Cependant les données de consommation relevées et transmises automatiquement pourraient être valorisées par des algorithmes afin de détecter les cas de suspicion de fraude. Bien qu’étant un sujet ancien, la détection de la fraude reste toujours d’actualité pour les distributeurs, et donc par répercussion pour les consommateurs.  

Etat des lieux de la fraude : méthodes, sanctions et coûts

La fraude ou le vol d’électricité, de gaz ou d’eau sur le réseau public est une pratique existante depuis de nombreuses années. Afin de limiter leurs consommations et ainsi leurs factures, certains clients modifient ou perturbent leurs installations de comptage. Ces cas de vols sont plus répandus pour l’électricité et l’eau, les installations de gaz étant plus difficiles à modifier en raison de leur dangerosité.

Les coûts afférents à la fraude sont répercutés dans les tarifs d’acheminent payés par les consommateurs finaux. Les pertes d’énergie ou d’eau dues aux fraudes appartiennent aux pertes non techniques (dysfonctionnement comptage, …) et sont régulièrement associées aux pertes techniques (fuites, effet joule, torchage…) afin d’être estimées dans leur ensemble. Il convient de noter qu’estimer le coût de la fraude est historiquement un exercice délicat en raison de la difficulté à la détecter. A l’aide des données de consommation et de distribution d’électricité et de gaz 2017, une estimation du coût des pertes techniques et non techniques peut être néanmoins réalisée. Le montant que le distributeur facturerait si ces pertes étaient de l’énergie vendue à un client est ainsi déterminé puis divisé par le nombre de foyers.

Pour l’énergie électrique, les pertes globales (pertes techniques et non techniques) sont considérées de l’ordre de 6%, parmi lesquelles les pertes non techniques représentent 40%. Pour le gaz, les pertes globales sont estimées de l’ordre de 0,66%, dont 60% de pertes non techniques. De plus, dans le cas de l’électricité, le gestionnaire du réseau Enedis estime qu’il y a un accroissement des pertes non techniques. En effet, la qualité du réseau seule, responsable des pertes techniques, ne peut expliquer l’augmentation constatée des pertes globales. Le coût des pertes pourrait donc augmenter si la tendance venait à se confirmer.

De nouveaux moyens de détection grâce aux Big Data

Le déploiement des compteurs communicants bouscule les pratiques de détection de la fraude et entraîne une obsolescence des méthodes classiques (contrôle physique des installations, vérification des plombages, analyse des alertes sauvegardées par le compteur…) pour offrir de nombreuses opportunités. En effet, les systèmes communicants permettent, notamment grâce aux données remontées, un contrôle au quotidien des consommations et le déclenchement d’alertes programmées pour détecter des anomalies de consommation.

Grâce à tous les recoupements de données que peuvent maintenant faire les distributeurs (données clients, données de consommation, données externes, …) des profils types élaborés des consommateurs peuvent être créés afin de déterminer la consommation standard d’un foyer de manière précise en fonction de ses caractéristiques. Du fait de la diversité et de la grande quantité des données disponibles par rapport au passé, ces profils types sont en principe beaucoup plus précis que les profils historiquement utilisés.

La création des profils types et la construction des algorithmes de prédiction de la consommation en fonction des caractéristiques clients nécessitent des compétences en science de la donnée. Les scientifiques de la donnée explorent dans un premier temps les données dont dispose le distributeur, les recoupent et les traitent pour appliquer dans un second temps des algorithmes de machine learning, un processus permettant de détecter des schémas dans les données et d’effectuer des prédictions en se basant sur des statistiques, de la reconnaissance de schémas et des analyses prédictives. L’application de différents modèles permet la comparaison des performances des méthodes testées et éventuellement l’agrégation des modèles. Suite à la création et à la sélection du modèle le plus performant, le processus de traitement des données, l’application de l’algorithme de prédiction et la détection d’anomalie doivent être industrialisés afin d’être appliqués aux nouvelles données entrantes.

Ainsi, la comparaison régulière de la consommation réelle à la consommation dite standard permet la détection d’anomalie. Des écarts répétés et dépassant un seuil fixé en amont peuvent déclencher des alertes chez le distributeur. Les cas suspects sont ainsi mis en exergue et font l’objet d’un processus de suivi et de traitement particulier à définir : un technicien peut être envoyé sur le terrain pour vérifier l’installation, un premier mail ou courrier à fins pédagogiques peut être envoyé etc.

Le Big Data : une aide précieuse mais pas miraculeuse

La valorisation des données suite au déploiement de nouveaux matériels communicants offre de nombreuses opportunités, notamment en termes de lutte anti-fraude. Cependant, ces opportunités sont accessibles sous certaines conditions. Il serait illusoire de voir en ces nouveaux matériels une solution miracle pour les problématiques que rencontre un distributeur de gaz, d’électricité ou d’eau. Le Big Data, la Data Science et les nouveaux matériels ne peuvent à eux seuls révolutionner les usages.

Le prérequis à la mise en place de toute démarche de Data Science est la mise à disposition et la complétude des bonnes informations. Les distributeurs doivent donc avant toute chose vérifier la remontée des informations client, déterminer les processus de récupération des données manquantes et effectuer des opérations pour compléter les données déjà en base présentant des lacunes. Sans les données adéquates et leur bonne qualité, toute démarche de data science restera peu performante. Les contraintes de confidentialité peuvent de plus ajouter une difficulté dans les activités liées à la récupération, au stockage et au traitement des données. Les distributeurs d’eau de gaz ou d’électricité sont dans l’obligation de respecter les libertés et la sécurité des données de leurs clients, et doivent ainsi mettre en place les processus de sécurité nécessaires (cryptage, …).

 La présence de données et leur bonne complétude ne suffisent pas non plus à la création de modèles performants. En effet, l’intelligence artificielle et le big data présentent des limites. Entraîner un modèle avec des données brutes récupérées en base ne pourra en aucun cas permettre d’obtenir des résultats intéressants et cohérents. Il est indispensable d’apporter de l’intelligence aux données avant de les exploiter dans des algorithmes : création d’indicateurs spécifiques par agrégation, normalisation… Il est également important de donner un sens métier aux indicateurs créés. Les interprétations des résultats des analyses pourront ainsi trouver des explications terrain permettant une compréhension des phénomènes. L’expertise métier est donc également très importante dans de telles démarches.

Enfin, le déploiement de nouveaux matériels induit aussi de nouvelles opportunités de fraude. Les nouvelles technologies déployées dans les compteurs communicants peuvent faire l’option d’opération de piratages ou autre tentative de corruption du matériel. Ainsi, les distributeurs doivent rester attentifs aux nouvelles formes de fraude et développer de nouvelles techniques de détection et de lutte.

 

Le vol d’électricité, de gaz ou d’eau sur le réseau public est un phénomène ancien qui peut représenter un coût non négligeable pour chacun des clients. Avec l’arrivée des nouveaux compteurs, de nouvelles méthodes peuvent être mises en place afin de détecter et lutter contre les cas de fraude. Ces méthodes consistent notamment à exploiter et valoriser les données disponibles grâce aux nouveaux matériels. Cependant, il convient de souligner que les méthodes liées au big data et à la data science ne pourront pas révolutionner la lutte anti-fraude sans respecter un certain nombre de prérequis et sans efforts de la part des entreprises. Les principes généraux des méthodes et processus mis en place pour lutter contre la fraude à l’énergie ou l’eau peuvent être repris et déclinés à de très nombreux domaines dans lesquels la fraude est aussi présente (grande distribution, assurance, transport, …) et représente un coût très important.