Opérateurs Monotones et Architectures Neuronales - Tirer Parti des Interactions pour des Approximations Structurées Physiquement – MONALISA
Les opérateurs neuronaux ont récemment rencontré un grand succès pour modéliser des systèmes dynamiques complexes tels que ceux régis par des équations aux dérivées partielles (EDPs). Leur avantage par rapport aux réseaux de neurones traditionnels réside dans leur capacité à modéliser des applications entre espaces de fonctions, capturant des dynamiques continues à différentes échelles, avec une performance indépendante de la discrétisation. Les opérateurs neuronaux informés par la physique vont plus loin en intégrant des contraintes physiques comme les EDPs. Entraînés via la minimisation de termes d'attache aux données et d'une régularisation physique, ils offrent des prédictions plus rapides que les solveurs numériques classiques. Cependant, les raisons précises de leur efficacité ne sont pas encore entièrement comprises. Un point crucial de cette exploration est de déterminer comment leur complexité est contrôlée, soit par des techniques explicites de régularisation, soit implicitement via leur architecture. Dans MONALISA, nous adoptons une approche ambitieuse en empruntant des outils de la théorie des opérateurs monotones, appliquée récemment à l’étude des applications non linéaires modélisées par des architectures neuronales, afin de mieux comprendre et maîtriser la complexité des opérateurs neuronaux informés par la physique. Pour contrôler implicitement leur complexité, un premier axe consistera à concevoir des opérateurs neuronaux dont l’architecture est guidée par des connaissances physiques comme les EDP. Nous formulerons l'action d'une couche opérateur comme la solution d'un problème d'optimisation régularisé sur des espaces de fonctions. Ensuite, nous étudierons l’impact de la régularisation explicite au niveau des couches et au niveau de la fonction de perte. Enfin, nous nous concentrerons sur l’application des interactions laser-matière, où structurer l’opérateur avec toutes les connaissances disponibles est crucial pour pallier la rareté des données.
Coordination du projet
Jordan Patracone (Laboratoire Hubert Curien)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Laboratoire Hubert Curien
Italian Institute of Technology
Sapienza University of Rome
UNIVERSITE LUMIERE LYON 2
Aide de l'ANR 287 609 euros
Début et durée du projet scientifique :
septembre 2025
- 48 Mois