CE45 - Mathématiques et sciences du numérique pour la biologie et la santé

Nouvelles approches pour combiner les réseaux métaboliques et la métabolomique non ciblée – MetClassNet

MetClassNet

Nouvelles approches pour combler le fossé entre les réseaux métaboliques à l'échelle du génome et la métabolomique non ciblée

La science des réseaux pour relever les défis de la métabolomique

1. Développer un nouveau cadre computationnel pour construire des réseaux multicouches intégrant différents réseaux basés sur la connaissance et des réseaux expérimentaux.<br />2. Développer des solutions informatiques de pointe exploitant la topologie multicouche pour améliorer la puissance de l'analyse du métabolisme, comme la prédiction de réactions, l'identification des métabolites, l'identification de nouveaux mécanismes, l'interprétation biologique ou la recherche de motifs fonctionnels.<br />3. Générer de nouvelles connaissances biologiques en utilisant la puissance combinée des approches ci-dessus. Nous utiliserons plusieurs exemples et applications des sciences de la vie pour valider et améliorer les réseaux.<br />4. Libérer les nouvelles solutions logicielles et les données vers la communauté. FAIR pour les données et les outils et fournir des tutoriels et des ateliers pour l'adoption des outils.

L'approche MetClassNet. Pour ce projet, nous émettons l'hypothèse que la combinaison de tous ces types (couches) de réseaux dans un cadre informatique intégré (réseau connecté multicouche) permettra d'accroître les connaissances métaboliques et d'obtenir de nouvelles informations sur les modulations métaboliques. En particulier, l'intégration des réseaux facilitera la tâche difficile de l'identification des métabolites en fournissant un contexte biologique et chimique (ontologies et GSMN) lié aux réseaux basés sur les données MS. Les GSMN bénéficieront également de cette intégration puisque les données MS et MS/MS permettront de combler les lacunes du GSMN (par exemple, sur le métabolisme des lipides).

Dépôt de la première étude lipidomique de C. elegans.
Implémentation de mzTab-M dans MSnbase.
Déploiement d'un pipeline Nextflow dans l'infrastructure HPC du CIRC pour analyser les données métabolomiques.
Backend MassBank pour les spectres (permet la correspondance des bibliothèques dans R pour MetClassNet). Permet la lecture de spectres au format MassBank dans R.
Le paquet MsBackendMassbank est accepté dans Bioconductor.
Mise en cache de ChemOnt dans le paquet R classyfireR.
Vignette de couverture. Une vignette qui montre à l'aide d'un exemple comment vérifier le chevauchement des classes de composés représentées dans un ensemble de données expérimentales et un GSMN.
Création d'une vignette qui utilise un jeu de données d'exemple pour générer les réseaux expérimentaux (différences de masse, corrélations, similarité spectrale) et les exporter au format .gml qui sera utilisé comme entrée pour MetClassNet.
Développement d'une liste de différences de masse des métabolites basée sur la règle des réactions chimiques.
Prototypage de la notation GNPS dans R Implémentation d'une notation de type GNPS pour les réseaux de similarité spectrale dans R. A l'avenir, elle sera utilisée par MetClassNetR.
Définition d'une architecture pour l'ensemble du système.
Serveur Neo4J installé sur de.NBI
création de GML2Cypher, un outil pour l'intégration des réseaux dans la base de données Neo4J.
Importation de ChEBI et ChemOnt, et importation des graphes dérivés de MTBLS1582 dans Neo4J.
création d'un tutoriel pour l'exploitation de la base de données Neo4J du consortium.
Collecte d'un ensemble de données sur C. elegans pour les tests. Différents jeux de données sur la métabolomique et la lipidomique de C. elegans ont été collectés et traités exactement de la même manière comme entrée pour le workflow MetClassNet.
Ensemble de données sur C. elegans analysé avec tous les réseaux expérimentaux. Un ensemble de données RP-LC-MS sur un modèle d'infection de C. elegans a été utilisé pour créer des réseaux de différence de masse, de corrélation et de similarité spectrale en utilisant MetNet et GNPS. Les résultats de l'annotation et de l'identification des métabolites à l'aide de différents outils ont été combinés et les données ont été préparées pour un premier réseau multicouche.
Analyse de l'étude de cohorte prospective sur le cancer du foie (450 cas/contrôle appariés) des ensembles de données métabolomiques non ciblées.
Génération du premier réseau à deux couches (réseau métabolique à l'échelle du génome + réseau de différence de masse à partir d'un ensemble de données expérimentales).
Wetlab : Collecte d'échantillons pour les stades de développement de C. elegans (pour tester MetClassNet).
Téléchargement du plan de gestion des données sur Opidor suivant le modèle ANR.

Définition d'algorithmes permettant d'exploiter l'architecture multicouche pour relever les défis de la métabolomique.
Application sur les données recueillies par le consortium.

1. L. Salzer, M. Witting. Quo Vadis Caenorhabditis elegans Metabolomics—A Review of Current Methods and Applications to Explore Metabolism in the Nematode. Metabolites. 2021. Open access: doi.org/10.3390/metabo11050284
2. Cecilia Wieder, Clément Frainay, Nathalie Poupin, Pablo Rodríguez-Mier, Florence Vinson, Juliette Cooke, Rachel PJ Lai, Jacob G Bundy, Fabien Jourdan and Timothy Ebbels (2021). Pathway analysis in metabolomics: recommendations for the use of over-representation analysis. Plos Computational Biology. Open access: doi.org/10.1371/journal.pcbi.1009105

Le métabolisme est un processus biologique clé qui est modulé dans les organismes vivants en réponse à l'exposition environnementale, aux variations génétiques et au régime alimentaire. Comprendre le métabolisme est essentiel pour améliorer la performance des plantes, leur contenu nutritionnel et pour comprendre la santé et le bien-être humain. Cette réponse métabolique peut être complexe, impliquant des centaines à des milliers de petites molécules (métabolites) reliées par des milliers de réactions biochimiques. Ensemble, ils constituent un réseau dense, dans son intégralité, souvent appelé “Genome Scale Metabolic Network” (GSMN). Dans ce contexte, la métabolomique est une approche fondamentale pour observer expérimentalement les changements du métabolome (ensemble de métabolites). L'une des principales plateformes analytiques pour mesurer le métabolome est la spectrométrie de masse (MS) qui est souvent couplée à des méthodes de séparation (par exemple, la chromatographie en phase liquide, LC-MS). Même si la technologie progresse rapidement, il reste plusieurs défis à relever pour l'adoption généralisée de la métabolomique. L'identification des métabolites demeure l'un de ces défis. Néanmoins, les données obtenues expérimentalement et les données in silico générées par le GSMN ne se chevauchent que partiellement et ne sont généralement pas étudiées simultanément.
Dans MetClassNet, nous faisons l'hypothèse que ces difficultés pourraient être surmontées en concevant de nouvelles structures de données et de nouveaux algorithmes qui exploiteront la connectivité (réseau) entre molécules. Cette approche intégrative renforcera la puissance de l'analyse des données en unifiant les réseaux GSMN et les réseaux obtenus à partir de données expérimentales. MetClassNet proposera donc un nouveau cadre de calcul et de nouvelles méthodes pour aider à relever les principaux défis métabolomiques de l'analyse et de l'interprétation des données. Ce cadre intégrera l'information provenant des données expérimentales et des réseaux GSMN en les reliant à l'aide d’un “mapping” direct, des ontologies et de l'information sur les classes chimiques.
À la fin du projet, MetClassNet offrira à la communauté un ensemble d'outils innovant où il sera possible d'aller au-delà de l'analyse des données métabolomiques basée sur des tableaux en les intégrant (et pas seulement en les exportant) dans un système de réseau. À cette fin, MetClassNet créera de nouveaux algorithmes et outils pour exploiter ces réseaux afin d'accroître notre connaissance du métabolome. Le cadre développé facilitera également la connexion entre la métabolomique et les GSMN, ce qui permettra de combler les lacunes des bases de données actuelles des réseaux métaboliques. Dans le cadre du projet MetClassNet, nous présenterons les avantages du cadre de calcul pour l'étude des modulations métaboliques liées au vieillissement, à la toxicologie, au cancer et à la nutrition. Enfin, le consortium MetClassNet mettra dans ses priorités la nécessité d'ouvrir les données, les protocoles et les logiciels à la communauté.

Coordination du projet

Fabien Jourdan (Institut National de la Recherche Agronomique Centre Toulouse - Occitanie)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

IPB Leibniz Institute of Plant Biochemistry / Bioinformatics & Mass Spectrometry
INRA TOXALIM - MEX Institut National de la Recherche Agronomique Centre Toulouse - Occitanie
CIRC Centre International de Recherche sur le Cancer
HMGU Helmholtz Zentrum München, German Research Center for Environmental Health / Research Unit Analytical BioGeoChemistry

Aide de l'ANR 985 818 euros
Début et durée du projet scientifique : janvier 2020 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter