CE38 - Révolution numérique : rapports au savoir et à la culture

Détection de la Corruption dans les Marchés Publics – DeCoMaP

DeCoMaP: Détecter la corruption dans les marchés publics

L'ouverture des données publiques (de la commande publique et des décisions de justice) offre désormais en France l'opportunité de croiser les données issues des contrats passés entre acheteurs publics et entreprises sélectionnées et celles des cas frauduleux identifiés par la Justice, ou les mauvaises pratiques repérées par les organes de contrôle.

Détection automatique des cas frauduleux

Projet fortement pluridisciplinaire, faisant le pont entre l'informatique, l'économie et le droit, DeCoMap a pour objectif de collecter, traiter et analyser les données des marchés publics français afin de créer un outil d'identification automatique de la corruption et de la fraude dans les marchés publics (automated red flagging) et de fournir une grille d'analyse normative permettant de mettre en évidence les principaux facteurs que les autorités publiques devraient identifier et auxquels elles devraient prêter attention.<br />Le projet prévoit la création d'une base de données complète sur les cas de corruption et de fraude, la collecte d'éléments de preuve empiriques provenant de sources juridiques diverses et hétérogènes, ainsi que la constitution de bases de données issues des données des marchés publics français permettant d’identifier avec précision acheteurs, fournisseurs et les liens entre ces différents acteurs.

DeCoMaP se situe à l'intersection de ces trois considérations : les évolutions réglementaires, les données ouvertes et les outils automatiques de détection des fraudes et d'analyse économique. Considérant que les données des marchés publics sont essentiellement de nature relationnelle, nous utiliserons notablement l'apprentissage automatique et les approches basées sur les graphes pour modéliser et automatiser la détection des fraudes.

Le cœur de notre contribution méthodologique est de proposer des méthodes de détection de fraude basées sur les graphes. Les informations relationnelles peuvent aider à améliorer la détection de la fraude et à comprendre son apparition. Les graphes sont le paradigme naturel pour modéliser ces informations : les sommets sont utilisés pour représenter les objets constituant le système (dans notre cas : fournisseurs et acheteurs, appels d'offres) et les arêtes pour représenter les relations entre eux (dans notre cas : remporter un appel d'offres). Plus précisément, nous utiliserons des graphes signés comme principal paradigme de modélisation.

- Production et ouverture d'une base de données des marchés publics français sur une dizaine d'années
- Production et ouverture d'une base de données des décisions de justices présentant les cas de fraudes avérées à la commande publique
- Production d'outils de détection automatique de situations frauduleuses dans les données des marchés publics
- Comparaison de la performance relative des outils de fouille de données dans et identification de la valeur ajoutée des approches basées sur l'analyse de graphes.
- Analyse juridique et économique des vulnérabilités des marchés publics
- Analyse juridique et économique des données essentielles au contrôle de la commande publique

-

-

L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C'est en particulier vrai des données des marchés publics, aujourd'hui disponibles, et sur lesquelles sont fondées l'espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l'efficacité du droit. Alliant Informatique, Économie et Droit, DeCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention. Soutenu par Transparency International France et Open Contracting Partnership, DeCoMaP regroupe 10 enseignants-chercheurs de 7 universités spécialistes du droit de la commande publique et du droit de la donnée, d'analyse économique et économétrique des marchés publics, d’analyse économique du droit, d'optimisation de graphes, et d'analyse et d'extraction de réseaux complexes. 4 membres de Datactivist, société coopérative spécialiste de l'Open Data et fortement impliquée dans l'ouverture des données de la commande publique, complètent le consortium.

Le projet vise à établir et analyser une base de données exhaustive des pratiques de corruption identifiées, s'appuyant sur une diversité de sources juridiques, primaires et secondaires.

La collecte des données nécessaires au projet est d'importance et permettra de constituer la première base de données relative aux pratiques de fraudes dans les marchés publics français. Le projet permettra ainsi d'établir et d’analyser, économiquement et juridiquement, cette vérité terrain.

DeCoMap proposera différents outils et méthodes afin d'extraire des graphes signés des données (brutes ou enrichies par l’analyse menée) ainsi obtenues. Ces outils seront complétés par des approches plus traditionnelles, économétriques ou de machine learning. Ces dernières permettront en outre d'enrichir l'information disponible dans le graphe à la fois au niveau des liens (les contrats entre les acheteurs publics et les fournisseurs sélectionnés) ainsi qu'au niveau des noeuds (les caractéristiques intrinsèques des acteurs). Les résultats obtenus avec ces différentes méthodes nous permettront de développer une approche hybride de détection de la fraude. Enfin, le projet DeCoMap calibrera les outils de classification à partir de la vérité terrain constituée au début du projet.

Appliquer l'outil calibré aux données de marchés récentes permettra d'identifier les situations a priori problématiques mais aussi les cadres contractuels vulnérables afin d’éclairer la décision publique. Une attention particulière sera apportée aux formats et aux types des données utilisées afin de contribuer aux débats sur l’Open Data et sur les instruments de justice prédictive.

La production d'un outil de visualisation publique des données terminera le projet, complété par la publication d'un guide de bonnes pratiques, s'appuyant sur les résultats fournis par l'outil développé, et ce afin de proposer aux acteurs de la commande publique ainsi qu'aux autorités de contrôle des pistes d'amélioration des pratiques.

Coordination du projet

Pierre-Henri Morand (Laboratoire Biens, Normes, Contrats)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

LBNC Laboratoire Biens, Normes, Contrats
LIA Laboratoire d'Informatique d'Avignon
CRA CENTRE DE RECHERCHES ADMINISTRATIVES
DATACTIVIST

Aide de l'ANR 311 714 euros
Début et durée du projet scientifique : septembre 2019 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter