CE46 - Modèles numériques, simulation, applications

Réduction de données massives pour la simulation numérique prédictive – DataRedux

Ces avance´es se feront selon plusieurs axes : par la de´finition et l’extraction de structures a` e´chelles interme´diaires dans des donne´es a` haute re´solution, diverses et he´te´roge`nes ; par l'identification des parties les plus importantes d’un ensemble de donne´es, assortie d’une repre´sentation simplifie´e du reste du syste`me ; par le de´veloppement de repre´sentations parcimonieuses via l’extraction de structures d’inte´re^t a` e´chelles diverses («me´sostructures«), et la construction de mode`les d'interactions entre me´sostructures de diffe´rents types. In fine, ceci permettra une meilleure inte´gration des donne´es dans les mode`les nourris par les donne´es, pour arriver a` la prise de de´cision.

Les travaux de mode´lisation de P3 concernant l’e´pide´mie de covid-19 ont eu un grand impact socie´tal, en termes d’estimation du risque d’importation de cas au tout de´but de l’e´pide´mie, puis par la fourniture de sce´narios concernant divers types de restriction, par l’e´valuation a posteriori de l’impact des diverses mesures et par la proposition de protocoles pour des re´ouvertures dans les meilleures conditions possibles.
Les travaux en collaboration de P3 avec P1 se sont de plus de´roule´s dans le groupe de travail sur le de´veloppement de l’appli TousAntiCovid : ces travaux de mode´lisation ont permis d’en valider l’efficacite´. Workpackages WP3, WP4
D’un point de vue the´orique, P1 et P2 ont contribue´ au de´veloppement de la the´matique des interactions d’ordre supe´rieur, c’est-a`-dire de comment aller au-dela` des re´seaux qui ne peuvent repre´senter que des interactions par paires : dans de nombreux contextes, en particulier sociaux, les interactions se font e´galement par groupes, et la mode´lisation doit donc e^tre adapte´e (avec en particulier les hypergraphes). P1 et P2 ont propose´ de nouveaux mode`les d’interaction et de contagion sociale, montrant une nouvelle phe´nome´nologie des processus de contagion, et de nouvelles me´thodes d’investigation des structures dans les hypergraphes temporels. Ces the`mes sont actuellement tre`s porteurs. Workpackages WP1, WP3, WP4
De plus, P1 et P2 ont propose´ de nouvelles proce´dures de repre´sentation et de plongement de re´seaux temporels dans un espace en dimension finie (« embeddings »), ce qui permet de conside´rer des ta^ches comme la pre´diction de la taille (ou du de´roulement complet) d’un processus e´pide´mique observe´ seulement partiellement. Enfin, des approches de CCA multi-vues sur graphes ont e´te´ propose´es. Ces me´thodes, embeddings ou CCA, ont de nombreuses applications potentielles. Workpackages WP1, WP2

Dans la prochaine pe´riode, nous pre´voyons de continuer les travaux dans les directions de´finies par les Workpackages, en particulier : de´veloppement et analyse d’une nouvelle me´thode de repre´sentation des re´seaux temporels permettant de de´tecter les changements d’un e´tat a` un autre dans ces re´seaux ; de´finition et analyse du « temporal rich club », ge´ne´ralisant le « rich club coefficient » aux re´seaux temporels ; de´finition de me´thodes de comparaison de re´seaux temporels ; de´finition et e´tude de processus de contagion sur hypergraphes, e´tude de leur pertinence pour les maladies infectieuses.

voir rapport

Résumé de soumission

DataRedux développera des méthodes radicalement nouvelles pour la réduction de la complexité des grands ensembles de données en réseau, afin d'alimenter des modèles réalistes de phénomènes de propagation.
De nombreuses données décrivant de manière détaillée le comportement et les interactions d’individus ou d’entités socio-économiques sont de nos jours disponibles. Il s’agit souvent de systèmes représentés par des réseaux, qui peuvent varier dans le temps, avec des données hétérogènes et avec des détails à différentes échelles et résolutions. Ces données peuvent aussi contenir des informations géographiques et temporelles et des métadonnées.
Ces riches sources d'informations et de connaissances sont utilisées pour alimenter un large éventail de simulations numériques de processus dynamiques. Les données seules, cependant, même en grande quantité, ne se transforment pas facilement en connaissances ou modèles prédictifs. La richesse et la diversité de l'information qu'elles contiennent soulèvent des défis cruciaux concernant leur analyse, leur représentation et leur interprétation, l'extraction de structures significatives et leur intégration dans des modèles.
Dans ce contexte, DataRedux propose un cadre innovant pour réduire la complexité des données tout en préservant leur richesse, en travaillant à des échelles intermédiaires. Notre objectif est d'atteindre une percée fondamentale dans la compréhension théorique et la représentation des données qui sont sous forme de réseaux, afin de les utiliser dans des modèles prédictifs. La nouveauté principale sera de définir des techniques de réduction en lien avec les processus dynamiques sur réseaux.
Dans ce but, nous développerons des méthodes pour passer des données brutes à l'information et la compréhension à différentes échelles, en extrayant des structures dans des données à haute résolution, diverses et hétérogènes. Notre méthodologie impliquera l'identification des parties les plus importantes d’un ensemble de données, tout en résumant de manière effective le reste du système, la définition de représentations tenant compte à la fois des dimensions structurelles et temporelles de réseaux temporels, le développement de représentations parcimonieuses via l’extraction de structures d’intérêt à échelles diverses ("mésostructures"), et la construction de modèles d'interactions entre mésostructures de différents types. Notre but est d'identifier des méthodes d'agrégation de données à des échelles intermédiaires et de nouveaux types de représentations de données qui conservent la richesse des informations des données d’origine, gardant leurs caractéristiques les plus pertinentes et résumant les propriétés les moins saillantes. Ceci permettra leur plus facile intégration dans les modèles nourris par les données, pour arriver in fine à la prise de décision.
Le programme scientifique de DataRedux bénéficiera de la synergie des expertises des partenaires. Le projet (48 mois) est organisé en six modules : quatre scientifiques, un sur la diffusion et un de gestion du projet. Il implique trois équipes de premier plan dans leurs domaines de recherche. Le coordinateur est l'équipe DANTE Inria de l'ENS Lyon, experte dans l'exploration de données massives et riches sur le comportement humain, dans les méthodes statistiques et la modélisation nourrie par les données de phénomènes de contagion sociale; l'équipe de Physique Statistique et Systèmes Complexes du CPT Marseille (CNRS), experte pour les réseaux complexes, les réseaux temporels, les processus de propagation, les processus dynamiques; le laboratoire EPIcx de l'INSERM, experte en épidémiologie computationnelle, en modélisation nourrie par les données et dans l’étude de la mobilité humaine.
Ce projet est une resoumission d’un projet classé deuxième sur la liste complémentaire de l’AAPG ANR 2018. La nouvelle version a été révisée pour tenir compte des remarques des évaluateurs et des résultats obtenus par les partenaires depuis l’an dernier.

Coordination du projet

Alain BARRAT (Centre National de la Recherche Scientifique Délégation Provence et Corse _Centre de physique théorique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

iPLESP Institut Pierre Louis d'épidémiologie et de santé publique
LIP Laboratoire d'Informatique du Parallélisme
CNRS DR12 _CPT Centre National de la Recherche Scientifique Délégation Provence et Corse _Centre de physique théorique

Aide de l'ANR 711 702 euros
Début et durée du projet scientifique : décembre 2019 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter