MN - Modèles Numériques 2013

Génération de populations synthétiques, localisées et socialement structurées pour la simulation sociale – GENSTAR

Résumé de soumission

La simulation sociale orientée agents est devenue une technologie de choix pour construire des outils d’aide à la décision pour la gestion des systèmes socio-environnementaux complexes. Les modèles produits sont utilisés pour produire des résultats de plus en plus réalistes. La question de l'intégration de grands corpus de données (démographiques, environnementaux ou géographiques) dans ces modèles devient ainsi de plus en plus cruciale.
Dans ces modèles, l’évolution des simulations est en grande partie due aux agents sociaux (qui peuvent représenter des individus, des foyers ou des institutions) dont le comportement est fortement déterminé par leurs attributs, leurs liens avec d’autres agents et leur position dans les mondes artificiels qu’ils peuplent. Maintenant que beaucoup de données sont disponibles (grâce aux initiatives Big Data ou Open Data), générer des populations synthétiques conformes aux données disponibles sur des populations réelles devient une nécessité et une préoccupation pour beaucoup de modélisateurs en sciences sociales. Bien que plusieurs approches aient déjà été proposées, la génération de population reste un défi scientifique et méthodologique important que nous avons l'intention de résoudre dans ce projet.
Le premier défi lié à cette problématique concerne la manipulation conceptuelle et opérationnelle des échelles, à savoir l'échelle à laquelle les populations ont besoin d'être générées et les échelles auxquelles les données sont (ou non) disponibles. Le rapport entre ces échelles impliquera l'utilisation de méthodes robustes et innovantes de changement d'échelle.
Le deuxième défi découle du précédent et nécessite la construction d'un outil adaptable. La nécessité de coupler plusieurs méthodes conceptuelles et opérationnelles doit s'appuyer sur une compréhension, description et documentation complète des objectifs et moyens de chacune de ces méthodes, afin que les utilisateurs puissent choisir les plus adaptées en fonction de leurs besoins ou étant donné un scénario de génération (objectifs, échelles, données disponibles, temps requis, etc.).
Le projet Gen* vise à combiner des approches et méthodes issues des mathématiques appliquées et de l’informatique afin d'intégrer et de manipuler des données de tout type et de générer des populations d'agents artificiels statistiquement valides. Des méthodes génériques qui seront appliquées à différents cas d'utilisation seront implémentées en R et Java afin d'être intégrées en tant que librairies open-source dans les plates-formes de simulation multi-agents existantes. Ces librairies seront complétées par un guide méthodologique complet et plusieurs tutoriaux permettant aux utilisateurs de maîtriser les différentes méthodes proposées et leurs combinaisons.
Enfin, une application autonome sera développée indépendamment des outils existants. Elle proposera graphiquement aux modélisateurs de concevoir et réutiliser des workflows reliant les différentes sources de données, les méthodes de la bibliothèque et des convertisseurs de données (dans l’esprit de la plate-forme Kepler) de manière à générer des populations artificielles.
Tous ces développements seront réalisés par le consortium du projet, qui a déjà une solide expérience dans la conduite de grands projets méthodologiques open-source en simulation multi-agents. Les outils produits seront principalement validés dans le cadre du projet sur plusieurs cas d’études fournis par les partenaires.
Notre objectif est enfin de construire, au cours des 42 mois du projet, une communauté d’utilisateurs et de développeurs. Les livrables (librairies, outils, documentation) seront disponibles régulièrement sous licence Open Source ; les retours de la communauté seront collectés au cours d’ateliers dédiés. Nous profiterons de tous les moyens de dissémination possibles pour inciter la communauté internationale à adopter, développer et améliorer les librairies Gen*.

Alexis DROGOUL (Unité de Modélisation Mathématique et Informatique des Systèmes Complexes)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

CASSIDIAN CASSIDIAN
IDEES Identités et Différentiations de l'Environnement des Espaces et des Sociétés
IRD Unité de Modélisation Mathématique et Informatique des Systèmes Complexes
IRIT Institut de Recherche en Informatique de Toulouse

Aide de l'ANR 561 393 euros
Début et durée du projet scientifique : août 2013 - 42 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.