DS04 - Vie, santé et bien-être

Une approche évolutive et systémique pour comprendre la fonctionnalité des longs ARNs non-codants – LncEvoSys

Une approche évolutive et systémique pour comprendre la fonctionnalité des longs ARNs non-codants

Les génomes eucaryotes sont transcrits à grande échelle et engendrent de milliers de longs ARNs non-codants, qui ne produisent pas de protéines. Les fonctions biologiques de ces ARNs non-codants restent à ce jour inconnues. Nous proposons d'appliquer une approche évolutive et systémique pour comprendre la fonctionnalité des longs ARNs non-codants, en étudiant les pressions de sélection naturelle qui agissent sur ces transcrits.

Evaluer la fonctionnalité des longs ARNs non-codants avec une approche évolutive et sytémique

1) Notre premier objectif est de développer une approche intégrative pour l’annotation fonctionnelle des longs ARNs non-codants, qui fournirait, en plus de leur localisation et structure génomique, des informations sur la proximité par rapport aux autres éléments fonctionnels du génome, sur leurs structures secondaires, etc. <br /> <br />2) Notre deuxième objectif est d’établir une approche puissante pour la détection de familles homologues de longs ARNs non-codants, qui sont nécessaires pour mettre en œuvre des analyses de leurs patrons d’évolution. Nous proposons d’incorporer de nouveaux paramètres dans la recherche d’homologues d’ARNs non-codants, tels que la conservation du contexte génomique et des structures secondaires des molécules d’ARN. <br /> <br />3) Notre troisième objectif est de développer des tests évolutifs des différentes hypothèses pertinente pour la fonctionnalité des longs ARNs non-codants. Notamment, nous proposons d’implémenter de nouvelles approches pour tester la présence de sélection naturelle agissant sur les patrons d’expression des longs ARNs non-codants, pour tester l’hypothèse d’une fonction liée à la production d’un transcrit dont la séquence est dispensable, mais la transcription est nécessaire. Nous proposons également d’évaluer les pressions de sélection agissant sur la localisation génomique des ARNs non-codants, pour tester leur implication dans la régulation des gènes voisins. <br /> <br />4) Notre quatrième objectif est d’analyser les mécanismes génomiques et épigénomiques qui mènent à l’apparition de nouveaux longs ARNs non-codants. Nous souhaitons ainsi utiliser les ARNs non-codants comme système modèle pour étudier l’apparition de nouveaux gènes.

Nous utilisons une approche interdisciplinaire, qui combine des analyses bioinformatiques avec des méthodes de génétique et de biologique moléculaire. Nous produisons et analysons de grandes quantités de données de transcriptomique. La méthodologie employée inclut le développement d’outils bioinformatiques pour analyser de manière efficace de grandes quantités de données « omiques », pour construire une « pipeline » pour l’annotation fonctionnelle des longs ARNs non-codants, et pour améliorer la détection de familles de longs ARNs homologues à grande distance évolutive. Nous utilisons de manière intensives les ressources computationnelles du centre de calcul du LBBE-PRABI et de l'IN2P3.

Après les premiers 18 mois du projet, nous avons réalisé de considérables progrès dans le développement d'une approche intégrative pour l'annotation fonctionnelle des longs ARNs non-codants. Cette approche a été en partie présentée dans une publications soumise récemment :

F. Darbellay, A. Necsulea (2019) Comparative transcriptomics analyses across species, organs and developmental stages reveal functionally constrained lncRNAs. Molecular Biology and Evolution, en révision.

En parallèle, nous avons analysé la variation des patrons d'expression et d'épissage des longs ARNs non-codants dans les populations humaines, en utlilisant des données de transcriptomique ex vivo (biopsies) produites par un partenaire du domaine bio-médical (M. Heim, Department of Biomedicine, University of Basel).

Nous espérons que notre project pourra contribuer à l’avancement de la recherche sur la biologie des longs ARNs non-codants, qui est actuellement dans une phase critique liée à la notre compréhension de la fonctionnalité de ces molécules. L’intérêt pour les longs ARNs non-codants a connu une croissance exponentielle ces dernières années, grâce au développement des techniques de génomique et transcriptomique à haut débit, qui ont permis leur détection à l’échelle du génome. Néanmoins, malgré des avancées méthodologiques importantes dans les domaines de la détection et quantification des longs ARNs non-codants, à ce jour les fonctions biologiques de ces molécules restent mystérieuses. Un débat contemporain met en opposition deux hypothèse : l’une qui propose que les longs ARNs non-codants représentent généralement du bruit transcriptionnel sans importance biologique, et l’autre qui propose que les longs ARNs non-codants ont généralement des fonctions biologiques essentielles. Le projet LncEvoSys a comme objectif de départager ces deux hypothèses, en évaluant la fonctionnalité des longs ARNs non-codants à la lumière de l’évolution.

Nous signalons deux articles soumis pour publication :

1. F. Darbellay, A. Necsulea (2019) Comparative transcriptomics analyses across species, organs and developmental stages reveal functionally constrained lncRNAs. Molecular Biology and Evolution, en révision.

Manuscrit disponible sur BioRxiv : www.biorxiv.org/content/10.1101/607200v2

2. A. Necsulea (2019), Phylogenomics and genome annotation. Chapitre dans la collection «Phylogenetics in the genomic era«, en revue. Editeurs: Nicolas Galtier, Céline Scornavacca.

Il a été récemment découvert que les génomes eucaryotes sont transcrits à grande échelle, engendrant de milliers de molécules d’ARN qui ne codent pas pour des protéines. Les ARNs non-codants sont divisés en plusieurs classes, comprenant des molécules essentielles pour le fonctionnement de la cellule eucaryote, mais également des transcrits dont les rôles biologiques sont à ce jour incertains. En particulier, les longs ARNs non-codants (lncARNs) forment une très abondante classe d’ARNs (estimée à plus de 60,000 transcrits dans le génome humain), dont les fonctions biologiques sont encore inconnues.
Dans le cadre de ce projet, nous proposons d’évaluer la fonctionnalité des lncARNs avec une approche évolutive.
Premièrement, nous proposons de développer une méthodologie intégrative pour l’annotation des lncARNs, qui fournira non seulement la localisation précise de ces transcrits dans les génomes de vertébrés, mais également leur positionnement par rapport à d’autres éléments fonctionnels et d’autres catégories de gènes dans les génomes.
Ensuite, nous souhaitons établir une méthodologie fiable pour la reconstruction de familles de gènes de lncARNs homologues, pour plusieurs espèces de vertébrés. Un important verrou technique est l’évolution rapide des séquences des lncARNs, qui empêche l’application des approches classiques de recherches d’homologues. Pour lever ce verrou, nous proposons d’incorporer de nouveaux paramètres dans la recherche d’homologues, tels que la conservation du voisinage génomique et la conservation des structures secondaires d’ARNs.
Nous développerons par la suite de tests évolutifs pour évaluer la fonctionnalité des lncARNs. Nous allons nous intéresser plus précisément aux pressions de sélection qui agissent sur les niveaux et patrons de transcription des ARNs non-codants, ainsi qu’aux contacts régulateurs entre régions distantes des chromosomes, impliquant des lncARNs. Nous allons également combiner des approches bioinformatiques et expérimentales pour tester la fonctionnalité d’un gène candidat, sélectionné sur la base de ses caractéristiques évolutives. Enfin, nous utiliserons les lncARNs comme un système modèle pour analyser une question fondamentale en biologie évolutive : l’origine des nouveaux gènes.
Les partenaires impliqués dans ce projet regroupent des bioinformaticiens, des généticiens et des médecins. Nous sommes donc bien placés pour évaluer la fonctionnalité des lncARNs avec une approche évolutive et systémique, ayant des implications biomédicales sur le long terme.

Coordinateur du projet

Madame Anamaria Necsulea (Laboratoire de Biométrie et Biologie Evolutive)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LBBE - CNRS Laboratoire de Biométrie et Biologie Evolutive

Aide de l'ANR 241 341 euros
Début et durée du projet scientifique : décembre 2017 - 36 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter