– NeMo
Les technologies modernes produisent de plus en plus de données organisées sous forme de réseau. De nombreux domaines scientifiques tels que la physique, la sociologie ou la biologie sont concernés par cette révolution des réseaux. L'étude de sous structures, appelées ici motifs, semble particulièrement pertinente pour les réseaux biologiques dans lesquels ces briques élémentaires constituent des unités fonctionnelles qui se combinent pour assurer la régulation de la cellule. Le premier objectif est de développer des méthodes statistiques permettant d'identifier les motifs exceptionnellement fréquents dans les réseaux biologiques. Pour cela, nous proposerons des définitions biologiquement pertinentes de motifs et des algorithmes efficaces pour en énumérer les occurrences dans des réseaux de grande taille. Nous proposerons ensuite des modèles de graphes aléatoires présentant des propriétés topologiques globales semblables à celles observées dans les réseaux biologiques, ainsi que des méthodes d'inférence précises et efficaces pour en estimer les paramètres. Nous déterminerons ensuite la distribution exacte ou approchée des comptages de motifs dans ces modèles. Un logiciel rendant tous ces résultats accessibles aux biologistes sera développé. Les motifs pouvant être considérés comme les briques élémentaires des réseaux, nous développerons dans un second temps des méthodes de comparaison de réseaux fondées sur leur composition en terme de motifs. Nous utiliserons également les motifs pour confronter les réseaux avec d'autres sources d'informations comme des mesures d'expression de gènes ; les modèles graphiques gaussien constituent un cadre naturel pour cette dernière étape. Pour tous les problèmes que nous aborderons, nous adopterons un point de vue théorique, fondé sur des résultats établis mathématiquement. La plupart des méthodes proposées dans la littérature bioinformatique repose sur des approches empiriques. Notre approche sera systématiquement fondée sur une formulation mathématique du problème, une définition précise des modèles stochastiques sous-jacents et des démonstrations rigoureuses de l'efficacité des méthodes proposées. Typiquement, nous nous proposons d'obtenir des résultats analytiques afin d'éviter le recours à des procédures de ré-échantillonnage trop coûteuses en temps de calcul.
Coordination du projet
Organisme de recherche
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE ILE-DE-FRANCE SECTEUR EST
Aide de l'ANR 180 000 euros
Début et durée du projet scientifique :
- 36 Mois