CE45 - Interfaces : mathématiques, sciences du numérique – biologie, santé 2025

Découvrir les dimensions significatives de la dynamique des épidémies pour une modélisation prédictive efficace dans l'usage des données – DiscoReel

Résumé de soumission

Les modèles mathématiques des épidémies des maladies infectieuses ont atteint une résolution inédite, intégrant l’hétérogénéité des contacts, de la mobilité, de la susceptibilité et des comportements aux échelles fines. Ces avancées, portées par les besoins de la santé publique de précision, reposent fortement sur des données massives et à haute résolution retraçant la dynamique des agents pathogènes et de leurs hôtes dans l’espace et dans le temps.
Cela soulève deux enjeux. D’une part, la disponibilité des données est souvent dictée par l’opportunité technologique plutôt que par les besoins sanitaires, ce qui engendre des inégalités dans la capacité à éclairer les décisions publiques et accroît les risques d’usage abusif des données personnelles. D’autre part, ces modèles complexes, bien qu’efficaces pour expliquer l’observé, peinent à extrapoler hors des contextes spécifiques d’entraînement, limitant leur utilité pour l’évaluation de scénarios ou la planification en santé publique.
Ce projet propose un changement de paradigme : plutôt que de développer des modèles toujours plus complexes exigeant toujours plus de données, nous visons à identifier les règles générales de faible dimension qui gouvernent la dynamique épidémique à travers les contextes, et à les extraire des données déjà disponibles.
Nous faisons l’hypothèse que, comme d’autres systèmes complexes, les épidémies peuvent être décrites par un nombre réduit de degrés de liberté effectifs et de lois dynamiques. L’objectif est d’extraire ces variables et de les rendre utilisables pour la modélisation prédictive, y compris dans des contextes réels à données limitées.
Le projet s’articule autour de deux axes méthodologiques. Le premier, ancré dans la science des systèmes complexes, mobilise les techniques du groupe de renormalisation adaptées aux processus épidémiques sur populations structurées. Il analysera comment les détails de l’histoire naturelle des maladies, l’échelle de description des comportements, et la résolution spatiale influencent les lois de propagation. Le flot de renormalisation permettra ensuite d’extraire les degrés de liberté pertinents, de les relier à des indicateurs observables, et d’identifier leurs lois d’évolution.
Le second axe repose sur l’apprentissage automatique et profond. Nous entraînerons des autoencodeurs variationnels sur des données épidémiques pour identifier des variables latentes résumant le comportement du système. Une régression symbolique sera utilisée pour découvrir les équations gouvernant l’évolution de ces variables et les relier à des données d’observation (surveillance, mobilité, climat).
Les objectifs scientifiques sont : (1) développer la théorie pour extraire des représentations de faible dimension ; (2) les relier à des données observables de surveillance, de mobilité ou environnementales ; (3) les utiliser pour extrapoler ou remonter en échelle de manière rigoureuse ; (4) tester leur robustesse prédictive dans des cas d’usage. Ces cas d’étude porteront sur deux enjeux sanitaires majeurs en Europe : les pathogènes respiratoires à transmission directe (grippe, SARS-CoV-2) et les par moustiques (dengue). Ils viseront à estimer l’impact d’événements climatiques extrêmes sur l’émergence et la persistance épidémique, et à évaluer si les descripteurs extraits peuvent générer des scénarios perturbés pour lesquels aucune donnée n’est disponible.
Les résultats attendus incluent les schémas de modélisation formels issus des deux approches, leurs implémentations numériques, et des modèles préentraînés capables de générer des scénarios dans les cas d’étude. Toutes les productions seront mises à disposition en libre accès.
En démontrant que les dynamiques épidémiques complexes admettent une représentation de faible dimension, et en fournissant les outils pour l’ exploiter, ce projet vise à poser les bases d’un écosystème de modélisation interprétable, généralisable et équitable au service de la santé publique.

Coordination du projet

Eugenio Valdano (SORBONNE UNIVERSITÉ)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

iPLESP SORBONNE UNIVERSITÉ

Aide de l'ANR 374 567 euros
Début et durée du projet scientifique : décembre 2025 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter