JCJC SIMI 2 - JCJC : Sciences de l'information, de la matière et de l'ingénierie : Sciences de l’information, simulation

Exploration et VIsualisation de Données rElationnelles dyNamiques – EVIDEN

EVIDEN : Exploration et VIsualisation de Données rElationnelles dyNamiques

Nous nous intéressons dans le projet EVIDEN à un axe de recherche émergeant de la visualisation d'information, l'exploration visuelle de données relationnelles dynamiques que nous représentons par des graphes. Notre objectif est d'avancer tant sur les plans conceptuels que méthodologiques pour concevoir des méthodes et algorithmes pour la représentation et la navigation dans de telles données.

Visualisation, exploration et interaction avec des données relationnelles dynamiques modélisées par des graphes

Nous avons pour identifié trois aspects liés au dynamisme des données sur lesquels nous souhaitons contribuer. Le premier porte sur l'évolution de la topologie des réseaux. Le deuxième est sur l'évolution d'attributs associés aux éléments et relations de ces réseaux. Ces deux premiers aspects portent plus particulièrement sur l'évolution non prédictible de ces réseaux. A l'opposé, le troisième aspect auquel nous nous sommes intéressés porte sur des évolutions prédictibles (quelles soient topologiques ou sur les attributs) car résultantes de l'interaction utilisateur.<br />Le domaine d'application cible de nos travaux de recherche est la bioinformatique et la biologie des systèmes. Nous avons proposé des prototypes permettant l'exploration visuelles de plusieurs types de réseaux issus de ce domaine, que ce soit les réseaux métaboliques (modélisant les réactions biochimiques d'un organisme), les réseaux d'interaction de protéines ou encore les réseaux d'interaction entre petits ARN non-codants. Nous avons aussi à la fin du projet entamé un travail sur l'analyse de réseaux sociaux.

Nous avons commencé par travailler sur un cahier des charges fonctionnels sur les graphes dynamiques permettant de spécifier toutes les opérations possibles sur ces derniers. Nous nous sommes d'abord concentrés sur l'adaptation de la structure de données de notre plate-forme support Tulip (http://tulip.labri.fr) afin qu'elle supporte les graphes dynamiques. Tulip est développée au Laboratoire Bordelais de Recherche en Informatique depuis plus de 13 ans. C'est une plate-forme robuste et éprouvée qui sert à notre équipe pour implémenter et tester nos travaux de recherche. C'est avant tout une librairie de manipulation et de visualisation de graphes statiques de grandes tailles. Nos développements sur le projet ont fait surtout l'objet de modules additionnels pour Tulip ou de logiciels tiers basés sur Tulip.

Nos résultats portent sur les différents aspects du dynamisme des données identifiés au préalable. Nous avons validé nos travaux avec la publication d'articles dans des revues et conférences à audiences internationales et nationales mais aussi par des communications orales parfois invitées. Ces communications sont principalement basées sur les développements logiciels développés.
Outre ces publications, nous avons pu développer les axes de recherche identifiés dans le projet en initiant des collaborations au sein du LaBRI jusqu'à l'international. EVIDEN nous a aussi permis d'obtenir de nouveaux financements que ce soit sous la forme d'appel à projet remportés ou de bourse de thèse.

Nos différents travaux sur le projet ont utilisé des données de taille modérée (quelques dizaines de milliers d'éléments). Les évolutions technologiques et d'usage impose un passage à l'échelle (quelques millions/milliards d'éléments) de nos méthodes qu'il nous faudra traiter. La taille de ces données nécessitera aussi l'adaptation de celles-ci aux nouvelles infra-structures type « cloud » ou « big data ».
Notre objectif initial était de produire une plate-forme générique pour la visualisation et la manipulation de graphe dynamique. Nous n'avons malheureusement pas encore abouti à une solution satisfaisante et suffisamment mûre pour une publication d'audience internationale. D'une part, nous avons sous-estimé la complexité de mise au point d'une solution générique qui prend en compte les différents types de dynamismes. D'autre part, les départs anticipés des ingénieurs contractuels, parfois plusieurs mois avant la fin de leur contrat, pour des CDI, a fortement ralenti les développements logiciels. Néanmoins, cette plate-forme générique existe à l'état d'ébauche. Nous souhaitons terminer ce travail et le proposer pour une publication de niveau international et ainsi sceller la collaboration entre les deux principaux acteurs du projet

Ce projet a fait l'objet de 10 publications internationales dans des revues ou conférences et 2 publications nationales dont « Une approche de visualisation analytique pour comparer les modèles de propagation dans les réseaux sociaux » par J. Vallet, B. Pinaud et G. Melançon pour la conférence Extraction et Gestion des Connaissances 2015 qui a reçu le prix du meilleur article académique. Les travaux de ce projet ont aussi fait l'objet de différentes présentations parfois invitées dans des séminaires ou groupes de travail nationaux et internationaux. Nous avons aussi développé les logiciels PORGY, Systrip et rNAV qui sont mis à la disposition de la communauté sur le site de Tulip.

Nous nous intéressons dans le projet EVIDEN à un axe de recherche émergeant de la Visualisation d'Information, l'exploration et l'analyse visuelle de données dynamiques. Notre objectif est d'avancer sur les plans conceptuels et méthodologiques pour concevoir et réaliser des méthodes et algorithmes pour la représentation et la navigation de données relationnelles dynamiques. Suivant le "pipeline" de visualisation, les recherches menées au sein du projet EVIDEN se concentrent sur quatre points : 1/ La définition d'une structure de données suffisamment versatile, souple et optimisée pour stocker des données relationnelles dynamiques de grande taille. Cette structure doit permettre une représentation en mémoire efficace garantissant des temps d'accès et de mise à jour les plus courts possibles. 2/ La conception de méthodes de décompositions et d'extractions de régions d'intérêts dans les données dynamiques. Les méthodes de décompositions doivent permettre d'une part de regrouper les éléments similaires et d'autre part doivent limiter les changements de groupes lors de l'évolution des données. Les méthodes d'extractions de régions d'intérêts doivent quant à elles permettre de détecter et d'extraire des sous-réseaux ayant des comportements atypiques. 3/ La conception de méthodes de visualisations de données dynamiques efficaces : nous concentrons ici nos effort sur deux axes principaux, la représentation visuelle à proprement parler des données dynamiques mais aussi la représentation visuelle du dynamisme associé aux données. 4/ La conception de méthodes d'interactions génériques sur les données dynamiques : Adapter et/ou redéfinir formellement les méthodes l'interactions classiques sur des données statiques est rendu nécessaire par le dynamisme des données.
Le projet EVIDEN présente un enjeu manifeste pour le domaine d'application que nous ciblons, puisqu'il s'agit d'aider à l'avancement de la recherche en bioinformatique et en biologie, et ultimement de contribuer aux progrès dans le domaine de la santé. Toutefois de nombreux autre domaines pourraient aussi profiter des retombées de ces recherches.

Coordinateur du projet

Monsieur Bruno Pinaud (UNIVERSITE BORDEAUX I) – bruno.pinaud@labri.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LaBRI UNIVERSITE BORDEAUX I

Aide de l'ANR 243 017 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter