CE12 - Génétique, génomique, ARN

Innovation évolutive par acquisition de nouveaux gènes – GoNG

Innovation évolutive par acquisition de nouveaux gènes

Nous utilisons la levure Saccharomyces cerevisiae comme organisme modèle pour explorer, au niveau de l'espèce et à l'échelle du génome, la dynamique de l'acquisition des gènes au moment où ils surviennent et avant qu'ils ne soient éliminés par sélection.

L'objectif de notre proposition est d'explorer systématiquement les mécanismes d'acquisition de nouveaux gènes accessoires et leurs contributions relatives à l'émergence de nouveautés évolutives.

Objectif 1. Analyse complète des trajectoires évolutives des NAG naturels. Nous analysons les trajectoires évolutives des NAG sur la base d'ensembles de données de génomique des populations de haute qualité et en utilisant des approches informatiques de pointe. Objectif 2. Mesures expérimentales de l'aptitude biologique des NAG naturels et artificiels. Nous mesurons l'effet de fitness des NAG naturels et artificiels en combinant l'édition du génome, la biologie synthétique et le phénotypage à haut débit. Objectif 3. Optimisation de la séquence et câblage des NAG dans le réseau cellulaire. Enfin, nous étudierons comment les NAG se connectent fonctionnellement aux réseaux cellulaires en mesurant la transcription, la traduction et les modifications post-traductionnelles pour les NAG naturels et artificiels dans divers environnements afin de quantifier leur expression et le niveau d'expression et d'intégration cellulaire. Au total, nous prévoyons de générer un large pool de données hétérogènes que nous intégrerons dans un cadre conceptuel unique, y compris des informations sur les niches écologiques et les antécédents génétiques.

Analyse du génome des levures et génétique moléculaire.

Nous utilisons des approches génétiques et génomiques modernes pour comprendre l'émergence, l'évolution et la fonction de nouveaux gènes accessoires. Certaines des nouvelles approches développées sont décrites dans la section ci-dessous, tandis que les autres méthodes sont décrites dans la demande.

Résultats

Nous avons assemblé un ensemble de données non redondant de 8 084 gènes codant pour les protéines comprenant (i) tous les gènes définis à l'origine dans le pangénome de la souche 1 011, (ii) 285 gènes de novo publiés et (iii) 340 ORF définis dans SGD non inclus initialement dans l'ensemble de données d'origine . Nous avons développé un nouveau pipeline bioinformatique pour examiner la conservation de la longueur des protéines pour ces 8 084 gènes à travers les 1 011 souches. Nous avons constaté que 6 332 gènes étaient conservés dans plus de 90% des isolats, 989 gènes séparaient entre 10 et 90% des souches et 763 gènes étaient absents de plus de 90% des souches.

Nous avons développé une nouvelle méthode pour détecter les allèles partagés entre S. cerevisiae et S. paradoxus et cela permet de détecter des introgressions avec une résolution sans précédent. Nous appliquons maintenant cette méthode à un sous-ensemble de 100 génomes qui capturent une grande partie de la variation de S. cerevisiae. Les résultats soulignent une histoire complexe et connectée entre les deux espèces, avec plusieurs cycles de croisements qui émergent de l'analyse des allèles partagés.

Nous utilisons CRISP / Cas9 pour introduire un codon stop dans la séquence codante de 32 gènes de novo pour lesquels les mutants d'insertion KanMX4 ne sont pas disponibles. Jusqu'à présent, nous avons réussi à générer des mutations non sensorielles dans 22 d'entre elles. Des tests préliminaires de phénotypage ont révélé des variations phénotypiques associées à ces mutations.
En parallèle, nous avons développé un pipeline pour rechercher 9 bases de données différentes afin de recueillir des informations sur l'expression et la corégulation des gènes ainsi que sur les interactions entre les gènes et les protéines, afin de prédire les voies fonctionnelles des gènes de novo. Cela nous a permis de prédire les propriétés fonctionnelles de 85 gènes de novo avec une fiabilité estimée à 75%.

Perspectives

Nous avons fait de grands progrès dans l'objectif 2 et produit des populations cartographiques pour mesurer les effets de fitness des gènes introgressés. Plusieurs expériences de pool ont déjà été séquencées, et certains gènes candidats intéressants ont été identifiés et sont actuellement à l'étude. Un document connexe sur le mécanisme sous-jacent qui génère l'introgression a été soumis.
Une fois que plusieurs NAG ont été testés et que leur contribution à la forme physique a été prouvée, nous commencerons les expériences décrites dans l'objectif 3.

Productions scientifiques et brevets

1. Tattini L*, Tellini N, Mozzachiodi S, D'Angiolo M, Loeillet S, Nicolas A and Liti G*. 2019. Accurate tracking of the mutational landscape of diploid hybrid genomes. Molecular Biology and Evolution. 36:2861-2877.

Résumé de soumission

Les innovations évolutives empruntent plusieurs chemins mutationnels mais une vision intégrée de l'acquisition de nouveaux gènes au niveau populationnel fait encore défaut. Les différents mécanismes qui génèrent ou introduisent de nouveaux gènes dans un génome agissent de manière continue tout au long de l'évolution, ce qui aboutit à des gènes d'âges différents. Cependant, la plupart des études sur les nouveaux gènes ont été menées au niveau interspécifique en comparant un seul génome de référence par espèce. La génomique des populations permet maintenant de faire évoluer le domaine de la génomique comparative en passant de l'étude de génomes de référence uniques a l'étude de pangénomes donnant accès aux variations individuelles de type présence/absence de gènes au niveau de la population. La collection de gènes présents dans une population est appelée le pangenome. Le pangenome comprend des gènes invariablement présents chez tous les individus et des gènes accessoires qui ségrégent dans la population à des fréquences variables. Ici, nous définissons les nouveaux gènes accessoires (NAG) comme le sous-ensemble de gènes accessoires qui ne sont pas hérités verticalement à partir de l'ancêtre de l'espèce mais qui ont été acquis ou ont émergés dans une sous-partie de la population au cours de la diversification de l'espèce. Les NAG proviennent principalement d'événements d'introgression, de transferts horizontaux de gènes (HGT) et d'émergence de gènes de novo. Lorsque de nouveaux gènes apparaissent, ils sont initialement présents à très basse fréquence dans une population, vraisemblablement chez un seul individu, et peuvent ensuite disparaître ou éventuellement augmenter en fréquence. Par conséquent, nous faisons l'hypothèse que la meilleure échelle de temps évolutive pour étudier les mécanismes d'acquisition de gènes serait au niveau de la population.
Nous proposons d'utiliser la levure Saccharomyces cerevisiae comme organisme modèle pour explorer, au niveau de l'espèce et à l'échelle du génome complet, la dynamique de l'acquisition des gènes au moment où ils apparaissent et avant qu'ils ne soient éliminés par sélection. Pour cela, nous bénéficierons à la fois de données de génomique des populations de haute qualité et de la possibilité d'effectuer des tests expérimentaux à grande échelle à un niveau non accessible dans tout autre organisme modèle. L'objectif principal de notre proposition est d'explorer systématiquement les mécanismes d'acquisition des NAG et leurs contributions relatives à l'émergence des nouveautés évolutives.
Dans un premier temps, nous analyserons les trajectoires évolutives des NAG grâce aux données de génomique des populations et à des approches computationnelles de pointe. En second lieu, nous mesurerons l'effet des NAG naturels et artificiels sur le fitness des souches en combinant des techniques d'édition de génome, de biologie synthétique et de phénotypage à haut débit. Enfin, nous étudierons comment les NAG s'intègrent fonctionnellement dans les réseaux cellulaires en mesurant le niveau de transcription, de traduction et de modification post-traductionnelle de NAG naturels et artificiels dans divers environnements afin de quantifier leur niveau d'intégration cellulaire. Au total, nous prévoyons de générer un grand jeu de données hétérogènes que nous intégrerons dans un cadre conceptuel unique comprenant des informations sur les niches écologiques et les fonds génétiques. En conclusion, ce projet fournira une vision à plusieurs niveaux des impacts fonctionnels et évolutifs des NAGs dans le pangenome de la levure et révélera des règles générales conduisant à l'évolution de nouveaux gènes et de nouvelles fonctions chez les eucaryotes.

Gianni LITI (Centre Cancer et vieillissement)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

CQB Biologie Computationnelle et Quantitative
Centre Cancer et vieillissement

Aide de l'ANR 493 487 euros
Début et durée du projet scientifique : septembre 2018 - 48 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.