Blanc SIMI 2 - Sciences de l'information, de la matière et de l'ingénierie : Sciences de l’information, simulation 2010

Langages, concepts de temps et modèles hybrides pour l'analyse de modèles incomplets en biologie moléculaire – BioTempo

Résumé de soumission

La biologie des systèmes s’est fortement développée ces dernières années et arrive maintenant à carrefour: elle est constituée de deux sous-domaines indépendant. La biologie intégrative formalise et annote des données reliées à des interactions cellulaires, et en extrait un signal par des méthodes probabilistes (modèles bayésiens, support vecteurs machine). Il s'agit alors de reconstruire des réseaux et d'aller vers la réalisation de nouvelles expériences. Elle nécessite néanmoins énormément de données, actuellement accessibles uniquement pour des organismes très connus. Le deuxième sous-domaine de la biologie des systèmes, la modélisation dynamique, concerne l'étude de modèles mathématiques ou informatiques pour décrire des interactions au sein d'un système afin de simuler son comportement et prédire ses principales propriétés. Ce domaine est à cheval entre math. et info. (selon que les variables sont discrètes ou continues). Il englobe le paramétrage de modèles à partir d’observations spatio-temporelles (pas-encore- accessibles à l’aide d’observations haut-débit). Les propriétés du système sont déduites d'analyse de sensibilité, de tests de robustesse ou de model-checking.

Au vu des attentes des biologistes, la distance entre biologie intégrative et modélisation dynamique est un des freins au développement de la biologie des systèmes. Pour combler cette distance, nous proposons de développer de nouveaux concepts tant informatiques que mathématiques pour les modèles dynamiques. Selon nous, la différence majeure entre les deux approches est la place laissée au temps. En effet, la biologie intégrative recherche des signaux significatifs par la comparaison de données d’origines diverses, les séries temporelles servent uniquement à calculer des corrélations. Le but de la modélisation dynamique, par contre, est de décrire des trajectoires (évolutions de produits au cours du temps) le plus finement possible, à l'aide de méthodes qui ne prennent pas en compte de nombreuses observations biologiques (liaisons protéiques, niveaux de variations globales, effets de knock-out).

Les nombreuses approches de modélisation ont pour caractéristique de corréler la représentation du temps à celle des variables. Grossièrement, les modèles peuvent être statiques (le temps n’est pas pris en compte - c’est l’objet principal de la biologie intégrative), chronologiques (le temps et les variables sont discrets - induisant des approches de vérification de modèles) ou chronométriques (le temps et les variables sont continus, souvent modélisés par des équations différentielles). La taille des modèles décroit fortement en le point de vue statique et le point de vue chronométriques, pour des raisons d'estimation de paramètres et d'efficacité. Notre but est de combiner et compléter ces approches (statiques, chronologiques et chronométriques) pour progresser dans l’analyse et l’interprétation des données. Il s'agira en particulier de décorréler la représentation du temps de la représentation des variables. Notre avons pour cela réuni des informaticiens spécialistes en théorie des graphes, en programmation logique, en vérification de modèles (y compris hybrides), en modélisation par chaines de Markov ainsi que des mathématiciens spécialisés dans la modélisation de systèmes biologiques incomplets. Tous les participants ont déjà été confrontés à des applications biologiques concrètes et ont pu juger des limites des méthodes actuelles. Des biologistes participeront aussi au projet pour tester et valider les développements sur trois applications (bactérie décomposant le cuivre, initiation de la traduction chez l'oursin, voie de signalisation humaine). Nous utiliserons des données déjà produites et sur des modèles préliminaires existant, ce qui permettra de se concentrer sur les défis informatiques posés par ces nouveaux concepts hybrides pour les systèmes en biologie tout en comparant les différentes approches sur des systèmes biologiques communs.

Coordination du projet

Anne Siegel (CNRS - DELEGATION REGIONALE BRETAGNE ET PAYS- DE-LA-LOIRE)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

CNRS / I3S CNRS - DELEGATION REGIONALE COTE D'AZUR
CNRS / IRISA CNRS - DELEGATION REGIONALE BRETAGNE ET PAYS- DE-LA-LOIRE
LINA UNIVERSITE DE NANTES

Aide de l'ANR 310 000 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter