Flash Info
Les communautés scientifiques rencontrant des difficultés liées à la crise ukrainienne dans la réponse à un appel ou la conduite d’un projet peuvent contacter l’ANR à impactukraine@anr.fr
CE45 - Mathématiques et sciences du numérique pour la biologie et la santé

Ensembles de Réseaux Booléens Prédictifs – BNeDiction

Résumé de soumission

En reliant les systèmes dynamiques et leurs observations partielles, les modèles informatiques des processus biologiques visent à découvrir des mécanismes clés gouvernant les dynamiques cellulaires, et in fine prédire leur comportement dans de nouvelles conditions.
Les modèles de réseaux d'interaction moléculaire sont généralement construits à partir de données sur la structure du système biologique, comme les interactions connues, et des données relative à leur dynamique, comme des mesures d'expression de gènes, ou l'activité de protéines à différents moments ou conditions. Cependant, malgré les avancés considérables des technologies expérimentales, les observations des processus biologiques restent très partielles, soit en termes de résolution temporelle, de nombre d'observables, de synchronisation entre différentes observtations, ou encore en termes de variété des conditions cellulaires. Combiné à une structure complexe d'interaction moléculaire, le problème de construction de modèle est alors largement sous-spécifié, amenant trop de candidats potentiels.

Les réseaux booléens (RB), et les modèles logiques en général, sont largement adoptés pour la modélisation des voix de signalisation et les réseaux de gènes et de facteurs de transcription, car ils ne demandent pas de connaissance précise sur les paramètres quantitatifs des interactions sélectionnées. Avec les RB, l'activité des composants est caricaturées à "faux" et "vrai", et leur évolution est calculée en suivant des règles logiques.
Cependant, en pratique, les données biologiques se traduisent encore par des multitudes de modèles candidats. Des choix arbitraires de modélisation doivent alors être faits, ce qui peut introduire des biais considérables dans les prédictions sous-jacentes.

Le projet BneDiction vise à produire une méthodologie générale pour le calcul de prédictions à partir de données sur la structure et la dynamique du système, en reposant sur des ensembles de RB.

Basés sur la constitution d’ensembles de modèles, nous cherchons à rendre compte de la diversité des modèles admissibles, et ainsi de réduire des bias pour la sélection d’un « meilleur » modèle par des critères arbitraires. Partant d'avancées récentes sur la caractérisation symbolique des modèles candidats par programmation logique, les défis majeurs résident autour de l'échantillonnage d'un ensemble de modèles divers, et le calcul et la maximisation de leur capacité prédictive, avec une évaluation approfondie du pipeline.

La modélisation par ensemble a le potentiel d’améliorer la robustess des prédictions en tenant compte de la variabilité et de l’incertutde potentielle des modèles. Nous prévoyons de démontrer l’application du pipeline BneDiction pour la modélisation par ensembles de l’hématopoïèse chez la souris à partir de données single-cell RNA-seq de différentiation, disponibles avec plusieurs contextes de mutation. Ce type de données apporte de fortes contraintes dynamiques pour l’inférence de modèle, et les différentes conditions de mutation permettent de constituer des jeux de données d’entraînement et de test afin d’évaluer la capacité prédicitive des ensembles de RB constitués par le pipeline.

Le projet aspire à produire une méthodologie convaincante pour l'apprentissage automatique de modèles logiques à partir de données expérimentales, une question clé à l'intersection entre intelligence artificielle et des sciences de la vie.

Coordinateur du projet

Monsieur Loïc Paulevé (Laboratoire Bordelais de Recherche en Informatique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LaBRI Laboratoire Bordelais de Recherche en Informatique

Aide de l'ANR 250 992 euros
Début et durée du projet scientifique : février 2021 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter