CE45 - Mathématique, informatique, automatique, traitement du signal pour répondre aux défis de la biologie et de la santé

Construction automatique de systèmes de signalisation à partir de la littérature – ABLISS

Résumé de soumission

Les récepteurs couplés aux protéines G (GPCR) sont des cibles de choix pour les médicaments. En effet, leur caractère membranaire les rend accessibles par voie sanguine, et ces récepteurs sont impliqués dans la majorité des processus cellulaires. De fait, plus de 30% des médicaments actuellement sur le marché ciblent des GPCR. Pour augmenter l’efficacité tout en diminuant les effets secondaires de ces médicaments, il est indispensable de mieux connaître la signalisation des GPCR. Les connaissances sur les différents récepteurs ont augmenté drastiquement ces dernières années. Mais cela entraîne une profusion de données omiques et d’articles scientifiques, dont l’intégration représente un véritable défi.
L’objectif de ABLISS est le développement d’une méthode pour reconstruire les réseaux de signalisation à partir de l’ensemble de ces données. La méthode comprendra deux composantes : (1) un module de traitement automatique des langues, permettant l’extraction des résultats expérimentaux dans les articles scientifiques et (2) une méthode de raisonnement à base de connaissances permettant d’inférer les réseaux à partir de ces données. La méthode sera appliquée à la compréhension de la signalisation ß-arrestine- et ERK-dépendante des récepteurs couplés aux protéines G.
Un premier workpackage sera consacré à la méthode à base de règles. Le principe est de formaliser en programmation logique ASP (Answer Set Programming) le raisonnement qui permet à l’expert de déduire des éléments du réseau de signalisation à partir de résultats expérimentaux. Puis l’ensemble des règles, ainsi qu’un ensemble de faits expérimentaux réels sont placés en entrée d’un module de raisonnement. Nous avons développé un premier prototype et ainsi démontré la faisabilité de la démarche. Dans le projet ABLISS, nous étendrons la base de règles pour prendre en compte plus de types d’expériences, mais également pour mieux adapter ce module de raisonnement aux structures prédicat-arguments qui peuvent être générées automatiquement par le module de traitement automatique des langues. Nous nous attacherons également à étudier la fiabilité d’un fait déduit, ce qui est particulièrement important dans le cas où des contradictions apparaissent dans les réseaux déduits. Enfin, nous développerons le raisonnement abductif, afin de construire des plans d’expérience pour valider des hypothèses sur le réseau.
Un deuxième workpackage sera consacré au module de traitement automatique des langues. Lors du travail préliminaire sur la méthode d’inférence de réseau, la nécessité de rechercher et formaliser manuellement les fait expérimentaux est apparue comme une limitation majeure. Nous avons montré que l’utilisation d’une cascade de transducteurs permettait d’extraire et de formaliser les structures prédicat-arguments de quelques types de résultats expérimentaux, directement à partir des publications scientifiques. Dans ABLISS, nous poursuivrons ce travail, notamment au travers de l’écriture d’une cascade pour l’extraction et la formalisation des faits expérimentaux obtenus à partir d’un grand nombre de types d’expériences. De manière itérative nous assurerons également la complétude de cet ensemble de prédicats. Enfin nous développerons des modules permettant de compléter les arguments de ces prédicats lorsque ceux-ci ne sont pas présents localement.
Le troisième workpackage sera consacré à l’application de la méthode à la reconstruction du réseau de signalisation ERK et ß-arrestine dépendant de plusieurs GPCR. Une première raison de ce choix est que le corpus de publications scientifiques concerné est relativement modeste (environ 1300 publications), permettant un contrôle manuel des résultats obtenus. Une deuxième raison est la bonne expertise de l’équipe coordinatrice du projet dans le domaine. Les éléments du réseau déduit seront validés expérimentalement.

Coordinateur du projet

Madame Anne Poupon (Physiologie de la reproduction et des comportements)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

PRC Physiologie de la reproduction et des comportements
LRI Laboratoire de Recherche en Informatique
EA6300 LABORATOIRE D'INFORMATIQUE

Aide de l'ANR 441 626 euros
Début et durée du projet scientifique : septembre 2018 - 48 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter