EXtremes, apprentissage STatistique et Applications – EXSTA
La Théorie des Valeurs Extrêmes (TVE) est la branche des probabilités et de la statistique dédiée aux événements rares associés aux queues de distributions, avec de nombreuses applications dans des domaines scientifiques variés où les événements extrêmes ont une importance particulière, et en gestion des risques. Ces dernières années ont vu se développer un cadre théorique inspiré de la théorie de l'apprentissage statistique et des algorithmes adaptés de l'apprentissage automatique pour l'analyse des extrêmes, en lien avec l'intérêt croissant de la communauté statistique pour les problèmes en grande dimension et la disponibilité croissante de jeux de données de grande échelle.
L'objectif du projet est de renforcer ces directions émergentes et d'encourager les interactions entre théorie et pratique. Le consortium rassemble des statisticiens dont les thèmes de recherche couvrent un large spectre, de la statistique mathématique et la théorie de l'apprentissage aux applications opérationnelles en sciences du climat et de l'environnement et dans l'industrie.
Le programme scientifique s'organise en deux axes, chacun intégrant des objectifs théoriques et des applications, (I) problèmes non supervisés en TVE, et (II) problèmes supervisés. L'axe (I) inclut les tâches suivantes: 1) Réduction de la dimension non supervisée et apprentissage de représentations parcimonieuses pour des données extrêmes multivariées, temporelles et fonctionnelles ; 2) Nouvelles méthodes d'apprentissage de quantiles extrêmes multivariés par le biais du transport optimal et de la profondeur de données ; 3) Réseaux de neurones: implémentation pour la simulation d'exemples extrêmes et garanties d'approximation ; 4) Applications à l'identification de motifs dans les extrêmes climatiques et à la simulation de conditions extrêmes, dans un contexte de changement climatique ; 5) Applications à des problèmes industriels en lien avec la détection d'anomalies et la maintenance prédictive. L'axe (II) rassemble les tâches d'apprentissage supervisé suivantes: 6) Régression de quantiles extrêmes et réduction de la dimension pour la prédiction d'occurrences de valeurs extrêmes à l'aide de covariables de grande dimension ; 7) Algorithmes de classification et de régression avec covariables extrêmes en entrée: adaptation au contexte des extrêmes et obtention de garanties théoriques non asymptotiques ; 8) Applications à la prédiction d'occurrence de précipitations extrêmes et à la qualification du risque d'inondation dans un contexte de changement climatique.
Les retombées attendues du projet incluent, en complément de publications scientifiques, le développement d'algorithmes sous la forme de logiciels libres implémentant les nouvelles méthodologies développées, en partie grâce au soutien des équipes d'ingénierie dédiées des établissements partenaires, et en lien avec des chaires industrielles et de recherche auxquelles participent les membres du projet.
L'aide demandée a pour vocation principale de financer trois thèses de doctorat d'une durée de trois ans co-encadrées par 9 participants, deux workshops, des frais de mission, et des moyens pour la dissémination des résultats et le transfert de connaissances.
Coordination du projet
Anne SABOURIN (Mathématiques appliquées à Paris 5)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
INRAE - BioSP INRAE -Biostatistique et Processus Spatiaux
LAREMA LABORATOIRE ANGEVIN DE RECHERCHE EN MATHEMATIQUES
MAP5 Mathématiques appliquées à Paris 5
Aide de l'ANR 460 655 euros
Début et durée du projet scientifique :
février 2024
- 60 Mois