CE26 - Innovation, travail 2021

Machine Learning et Econométrie pour la Mesure des Risques en Finance – MLEforRisk

Combiner le Machine Learning et l’Économétrie pour mieux mesurer les risques financiers

Renouveler la mesure du risque financier par l’articulation entre économétrie et machine learning

Le développement rapide des méthodes d’apprentissage automatique transforme profondément les pratiques de mesure et de gestion du risque en finance. Si ces méthodes offrent des gains substantiels en performance prédictive, leur utilisation soulève des enjeux scientifiques, opérationnels et réglementaires majeurs, liés à l’opacité des modèles, à la robustesse des estimations, à l’interprétabilité des résultats et à leur acceptabilité par les autorités de supervision. À l’inverse, les modèles économétriques traditionnels, bien que fondés sur des cadres théoriques solides et largement utilisés en pratique, montrent leurs limites pour capturer certaines non linéarités, interactions complexes et dynamiques instables observées dans les données financières. L’enjeu central du projet MLEforRisk est de dépasser cette opposition entre modèles économétriques interprétables mais parfois restrictifs et algorithmes d’apprentissage automatique flexibles mais difficiles à contrôler. Le projet vise à construire des cadres méthodologiques hybrides permettant de concilier performance prédictive, interprétabilité économique et rigueur méthodologique, tout en restant compatibles avec les contraintes opérationnelles et réglementaires du secteur financier. Les objectifs scientifiques du projet sont triples. Le premier consiste à développer des méthodes d’estimation et d’inférence adaptées à des modèles dynamiques complexes, incluant des structures non linéaires, des dépendances fortes et des distributions peu régulières, tout en garantissant des propriétés théoriques solides. Le deuxième objectif est d’intégrer de manière contrôlée des outils issus de l’apprentissage automatique dans des cadres économétriques, afin d’améliorer la prévision du risque sans sacrifier la compréhension des mécanismes sous jacents. Le troisième objectif porte sur la validation et la gouvernance des modèles de risque, à travers l’évaluation de la performance hors échantillon, l’analyse de l’équité algorithmique et le développement de tests statistiques adaptés aux exigences prudentielles. En combinant développements théoriques, contributions méthodologiques et applications empiriques à des données financières et bancaires, MLEforRisk ambitionne de fournir des outils de mesure du risque robustes, interprétables et opérationnels, contribuant à une meilleure gestion du risque financier et à une finance plus responsable.

Méthodes économétriques et Machine Learning pour la mesure du risque financier

Le projet MLEforRisk s’appuie sur une approche méthodologique visant à articuler étroitement économétrie financière et apprentissage automatique afin de renouveler les outils de mesure du risque de crédit, de marché et de liquidité. L’approche consiste à dépasser l’opposition entre modèles économétriques interprétables mais restrictifs et algorithmes de ML flexibles mais opaques, en développant des cadres hybrides combinant performance prédictive, interprétabilité et rigueur statistique, tout en restant compatibles avec les contraintes opérationnelles et réglementaires du secteur financier.

Dans le domaine du risque de crédit, les méthodes reposent sur l’enrichissement de modèles économétriques standards par des techniques issues de l’apprentissage automatique destinées à capter des non linéarités et des interactions complexes. Cette approche se traduit notamment par l’intégration de règles extraites de modèles de type arbres de décision dans des cadres économétriques pénalisés, permettant d’améliorer la performance prédictive tout en conservant des propriétés d’interprétation et d’inférence statistique. Les travaux portent également sur la comparaison systématique des performances prédictives et économiques des modèles économétriques et de ML dans des contextes de scoring de crédit réalistes.

Les méthodes évoluent ensuite vers une prise en compte explicite des enjeux d’équité algorithmique. Le projet développe des tests statistiques formels permettant d’évaluer différentes définitions de fairness ainsi que des outils d’interprétabilité dédiés à l’identification des variables responsables de biais de discrimination. Des procédures de correction fondées sur des méthodes de post traitement sont également proposées afin d’améliorer l’équité des modèles sans dégrader significativement leur performance prédictive.

Pour le risque de marché, le projet mobilise des modèles multivariés de grande dimension fondés sur des systèmes dynamiques et des modèles de dépendance conditionnelle. Les approches reposent sur des cadres économétriques parcimonieux et sur des techniques de régularisation visant à rendre l’estimation faisable lorsque le nombre d’actifs est élevé. Ces méthodes évoluent vers des développements théoriques montrant comment des systèmes multivariés de faible ordre peuvent générer des comportements de mémoire longue au niveau individuel, tout en améliorant la prévision du risque.

En parallèle, le projet développe des procédures de validation statistique des mesures de risque systémique. Il propose notamment des tests de backtesting pour des mesures de risque systémique, intégrant explicitement le risque d’estimation.

Résultats

Le projet MLEforRisk a permis de mieux comprendre comment les méthodes de Machine Learning (ML) peuvent être utilisées de manière fiable et responsable pour mesurer le risque financier. Un premier résultat marquant est la mise en évidence du fait que les algorithmes de ML, lorsqu’ils sont utilisés seuls, peuvent améliorer la précision des prévisions mais présentent aussi des limites importantes en termes de compréhension, de stabilité et d’équité. Le projet montre qu’il est possible de dépasser ces limites en combinant le ML avec des méthodes économétriques, afin de construire des modèles à la fois performants et interprétables.

Les travaux du projet ont conduit à de nouveaux outils permettant d’expliquer plus finement pourquoi un modèle de risque prend certaines décisions, par exemple dans le cadre de l’octroi de crédit. Ces approches rendent les modèles plus transparents pour les utilisateurs, les institutions financières et les autorités de contrôle. Le projet a également développé des méthodes permettant de détecter et de corriger des biais potentiels dans les modèles, contribuant ainsi à limiter les risques de discrimination algorithmique et à renforcer l’acceptabilité sociale de ces outils.

Un autre résultat important concerne l’amélioration des méthodes statistiques utilisées pour analyser l’évolution du risque dans les marchés financiers. Le projet a permis de mieux prendre en compte l’instabilité des marchés, les dépendances complexes entre actifs et la survenue d’événements extrêmes. Ces avancées offrent une compréhension plus fine des dynamiques du risque et améliorent la fiabilité des outils utilisés pour suivre les tensions financières et anticiper des phases de fragilité du système financier.

Enfin, le projet a eu un impact notable sur la diffusion des connaissances auprès du public et des décideurs. Les résultats ont été présentés dans des conférences internationales, lors de workshops dédiés aux jeunes chercheurs et dans des instances institutionnelles impliquées dans la supervision financière. À travers ces actions, MLEforRisk a contribué à nourrir le débat public sur l’usage du ML en finance et sur les conditions nécessaires pour que ces technologies soient mises au service d’une finance plus fiable, plus transparente et plus responsable.

Perspectives

Les résultats du projet MLEforRisk ouvrent plusieurs perspectives scientifiques et applicatives à moyen et long terme. Sur le plan méthodologique, les avancées réalisées en matière d’inférence dans des modèles dynamiques complexes et dans l’intégration contrôlée du ML au sein de cadres économétriques constituent un socle pour de nouveaux développements. Une première perspective concerne l’extension de ces approches à des environnements de plus grande dimension, intégrant simultanément dépendances temporelles, dépendances croisées entre actifs et hétérogénéité non observée, tout en conservant des garanties de robustesse et d’interprétabilité.

Les travaux sur l’explicabilité des modèles et la décomposition de la performance prédictive ouvrent également des perspectives importantes pour une meilleure compréhension des mécanismes à l’origine des décisions algorithmiques. Ils appellent des prolongements sur la stabilité des modèles dans le temps, l’analyse des changements de régime et l’identification précoce de signaux faibles annonciateurs de dégradations du risque. Ces développements sont particulièrement pertinents dans des contextes où les modèles doivent être suivis, audités et régulièrement recalibrés.

En matière de risque de crédit et d’équité algorithmique, les méthodes développées peuvent être étendues à des cadres dynamiques, à des données multi sources et à d’autres formes de décisions automatisées en finance. Elles ouvrent la voie à une analyse conjointe de la performance économique, du risque et des enjeux d’acceptabilité sociale des modèles, dans un contexte réglementaire en évolution.

Les contributions du projet sur la modélisation du risque de marché et des dépendances complexes offrent également des perspectives pour améliorer les outils de suivi des tensions financières et pour enrichir les dispositifs de stress tests macro et micro prudentiels. Des prolongements sont envisagés vers des cadres multi pays et multi secteurs, ainsi que vers l’analyse de scénarios intégrant explicitement des chocs macroéconomiques ou financiers.

Enfin, le projet a structuré une dynamique scientifique durable à l’interface entre économétrie et ML, notamment à travers l’organisation de la conférence QFFE et des workshops dédiés aux jeunes chercheurs. Cette dynamique ouvre des perspectives de nouvelles collaborations internationales, de projets interdisciplinaires et de formations avancées, contribuant à inscrire durablement ces thématiques au cœur de la recherche en économétrie financière.

Résumé de soumission

L'utilisation de l'intelligence artificielle et de l'apprentissage automatique (Machine Learning ou ML) par les banques et les Fintechs est l'un des changements technologiques les plus importants du secteur financier observés au cours des dernières décennies. Ces nouvelles technologies apparaissent très prometteuses pour de nombreuses activités financières mais elles soulèvent également de nouveaux défis. Dans ce contexte, le projet MLEforRisk vise à mieux comprendre l'utilité de la combinaison de l'économétrie et du ML pour la mesure des risques financiers. Ce projet a pour ambition de fournir une étude rigoureuse des avantages et des limites de ces deux approches dans le domaine de la gestion des risques qui constitue l’activité centrale de l’industrie financière. MLEforRisk est un projet multidisciplinaire dans les domaines de la finance et de l'économétrie financière qui réunit des chercheurs débutants et confirmés en gestion, économie, mathématiques appliquées et data science.
Le projet s’articule autour de cinq objectifs méthodologiques en rapport avec la modélisation des risques de crédit, de marché et de liquidité. Dans le contexte du risque de crédit, les méthodes de ML sont connues pour fournir de très bonnes performances de classification. Toutefois, ces méthodes s’apparentent souvent à des boîtes noires ce qui est particulièrement problématique tant pour les clients que pour les régulateurs. Ainsi, notre objectif est de développer des approches hybrides de modélisation du risque de crédit en combinant économétrie et ML afin de dépasser l’arbitrage entre interprétabilité et performances prédictives. Parallèlement, l'utilisation du ML dans le domaine du crédit suscite un débat sur les potentiels biais de discrimination que ces algorithmes pourraient générer en désavantageant systématiquement certains groupes d’emprunteurs. Notre objectif est de développer des méthodes statistiques permettant de tester l’équité algorithmique des modèles de risque de crédit et de réduire l’importance de ces biais.
Dans le domaine du risque de marché, le projet vise à combiner les techniques de ML et des modélisations économétriques avancées dans le but d’améliorer la prévision des mesures de risque conditionnel associées à la détention d’un portefeuille d’actifs. Notre objectif est de proposer de nouvelles approches hybrides pour la modélisation de la matrice de variance conditionnelle des rendements ou de son inverse, appelée matrice de précision. Puisque ces mesures de risque conditionnent les stratégies d’allocation, la précision de leur estimation est essentielle pour l’industrie de la gestion d’actifs. Ces méthodes d’estimation seront conçues dans la perspective de portefeuilles de grande dimension pour lesquels le nombre d’actifs peut dépasser très largement le nombre d’observations temporelles disponibles pour estimer ces moments. Un second objectif consiste à prendre en compte l’asymétrie de la distribution des rendements dans la modélisation des risques grâce à des techniques inspirées du ML.
Enfin pour ce qui concerne le risque de liquidité, nous partons du constat que le développement des indices de marché alternatifs et l'investissement factoriel modifient sensiblement la dynamique des volumes échangés sur les marchés en accroissant notamment les dépendances et les effets de réseaux. Notre objectif est de prendre en compte ces effets afin d’améliorer la mesure du risque de liquidité tout en limitant la dimension des modèles économétriques grâce à des techniques de ML.
Le projet MLEforRisk vise à constituer un réseau de recherche et de formation doctorale pour les jeunes chercheurs spécialisés en économétrie financière. Il vise en outre à promouvoir une recherche reproductible. L'ensemble des codes et des données produits dans le cadre du projet seront archivés sur RunMyCode et la reproductibilité des résultats numériques sera certifiée par cascad, première agence de certification pour le code et les données scientifiques.

Christophe HURLIN (Laboratoire d'économie d'Orleans)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

DRM Dauphine Recherches en Management
AMSE Aix Marseille School of economics
CREST Centre de Recherche en Economie et Stastistique - CREST
LEO Laboratoire d'économie d'Orleans

Aide de l'ANR 393 120 euros
Début et durée du projet scientifique : novembre 2021 - 42 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.