Blanc SVSE 6 - Sciences de la vie, de la santé et des écosystèmes : Génomique, génomique fonctionnelle, bioinformatique, biologie systémique

Déchiffrer la biologie des génomes grâce à une combinaison unique de Génomique comparative, Génomique fonctionnelle et Génomique populationnelle (3G) – GB-3G

La recherche fondamentale en biologie s’est développée autour d’organismes modèles représentant seulement quelques unes des innombrables espèces vivantes. Pour la plupart, ces organismes modèles sont évolutivement très éloignés les uns des autres et cette distance ne permet pas d’aborder de manière fine les mécanismes qui régissent l’évolution des grands processus cellulaires. Grâce aux techniques récentes de séquençage à haut débit de la totalité de l'ADN contenu dans les cellules, il est désormais possible de transformer virtuellement n’importe quelle espèce en nouvel organisme modèle ce qui permet d’éclairer les mécanismes d’évolution de processus biologiques majeurs. C’est ce que nous avons entrepris ici, avec l’étude d’un groupe d’espèces de levures, les Lachancea, choisi en fonction de ses caractéristiques évolutives remarquables. Dans un premier temps, ce travail aura des retombées purement fondamentales. Toutefois, il est important de remarquer que les mécanismes responsables de l’évolution des génomes sont équivalents aux mécanismes d’apparition de nombreuses maladies génétiques et de la transformation d’une cellule normale en cellule cancéreuse. Nos travaux présentent donc un enjeu potentiellement important en santé humaine.

Nous avons accumulé des résultats essentiels à la réalisation de nos objectifs sur les différents axes développés. Premièrement, nous avons réalisé le séquençage, l’assemblage et l’annotation du génome de sept espèces de Lachancea ce qui permet d'avoir l'ensemble du répertoire de gènes existants dans un clade eucaryote complet. Ce résultat sera crucial pour la compréhension des mécanismes de fonctionnement de ces génomes tels que la réplication (passage d'une copie à deux copies des chromosomes avant la division cellulaire), la recombinaison (brassage de l'information génétique entre générations) et également pour l'étude de l'évolution de ces génomes notamment par la reconstruction du génome de l'ancêtre de ces espèces. Nous avons notamment accumulé des indices qui suggèrent que ces espèces peuvent changer de sexe à haute fréquence ce qui n'était pas du tout attendu chez ce groupe d'organismes. Deuxièmement, nous avons déterminé et assemblé les génomes mitochondriaux de cinq espèces ce qui éclaire l’évolution de ces génomes et fait l’objet d’une publication. Troisièmement, nous avons déterminé le profil de réplication de 4 espèces apparentées ce qui représente une avancée majeure dans la compréhension de l’évolution de ce processus dans un groupe d’espèces différent des organismes modèles classiques. Quatrièmement, nous avons progressé de manière significative dans l’analyse des relations entre la composition du génome (génotype) et les caractères visibles (phénotype). Nous avons séquencé le génome de 28 souches différentes de l'espèce emblématique de ce groupe, Lachancea kluyveri, et analysé certains de leurs phénotypes dans 60 conditions environnementales. Cinquièmement, nous avons caractérisé un processus mutationnel unique qui serait responsable d'une modification très importante de la composition en base du génome de L. kluyveri. Finalement, nous avons construit des outils nécessaires à l’analyse de la recombinaison méiotique chez L. kluyveri.

Notre projet est pionnier en matière d’exploration génomique fonctionnelle d’un groupe d’espèce centré autour d’une référence qui n’est pas un organisme modèle. Nous nous attendons à ce que ce projet soit le premier d’une longue liste car il semble clair qu’en matière de régulation des processus biologiques, les voies explorées par les quelques organismes modèles à ce jour ne reflètent qu’une petite partie du champ des possibles biologiques.

L’obtention des séquences de novo du génome de sept espèces de levures nous a permis de mettre en place un outil automatisé très puissant qui réalise l’annotation pratiquement complète d’un génome en quelques minutes. Cet outil d'annotation a été développé sous la forme d'un pipeline Amadea BiopackR (ISoft). Les données de séquences nous ont permis de déterminer la structure, le polymorphisme et l’évolution des génomes mitochondriaux au sein des levures Lachancea et fait l’objet de 2 publications (G3 and Plos One). Finalement, l’analyse de l’évolution de la quantité d’ADN au cours du cycle cellulaire de L. kluyveri nous a permis de déterminer son profil de réplication de l’ADN et ce qui a fait l’objet d’une autre publication (Genome Biol Evol). Au total, ce projet à déjà permis de réaliser 19 communications dans des congrès scientifiques nationaux et internationaux et de publier 7 articles originaux (Mol Biol Evol, Nature, Plos Genetics et J Logic Comput).

Résumé de soumission

Grâce au développement de la génomique et plus spécifiquement des nouvelles technologies de séquençage, il est maintenant possible de s'affranchir des organismes modèles et de concentrer nos efforts sur d’autres espèces présentant des caractéristiques particulières pour aborder de nouvelles questions biologiques. C'est le cas du clade Lachancea qui contient 8 espèces décrites. Ces espèces sont dites "protoploïdes" car elles ont divergé de la lignée des Saccharomyces avant la duplication ancestrale du génome. Le projet GB-3G a pour objectif à long terme d'élucider les mécanismes moléculaires moteurs du fonctionnement et de l'évolution des génomes. Il repose sur une combinaison unique de génomique comparative, fonctionnelle et populationnelle qui permettra de décrire l'intégralité d'un clade eucaryote, à la fois au niveau inter-spécifique et au niveau intra-spécifique.

En plus de partager les mêmes atouts expérimentaux que les Saccharomyces, les levures Lachancea présentent des caractéristiques phylogénétiques et génomiques qui font d'elles un bien meilleur modèle pour l'étude de l'évolution de plusieurs processus cellulaires fondamentaux. Premièrement, les levures Lachancea sont faciles à manipuler au niveau expérimental et elles présentent un cycle sexuel complet. Elles constituent donc un excellent modèle pour l'étude comparée de la biologie des levures protoploïdes par rapport aux levures ayant subi la duplication complète du génome. Deuxièmement, le clade Lachancea fournit un bon compromis entre une échelle évolutive relativement grande et une conservation de l'organisation des génomes relativement bonne. La combinaison de ces deux propriétés est assez unique chez les levures car, à l'exception du genre Saccharomyces dans lequel les espèces sont peu divergentes et ont des génomes quasiment colinéaires, une réorganisation génomique considérable s'est produite entre toutes les autres espèces. Ces propriétés sont cruciales pour la réalisation de plusieurs de nos objectifs car l'échelle évolutive au sein du clade Lachancea est assez grande pour fournir suffisamment de signal afin d'identifier des changements évolutifs majeurs mais suffisamment limitée pour permettre d'en décrypter les mécanismes sous-jacents. Enfin, le génome de L. kluyveri présente une composition hétérogène inhabituelle avec une région de 1 Mb montrant une richesse considérable en bases G+C par rapport au reste du génome. Cette particularité fournit une occasion unique de découvrir les mécanismes responsables de l'évolution de la composition en nucléotides des génomes eucaryotes.

Nous proposons de générer une encyclopédie génomique inter-spécifique et intra-spécifique du clade Lachancea. Pour cela, nous séquenceront d'une part les génomes des 5 espèces non encore séquencées et celui d'une souche qui pourrait représenter une neuvième espèce du clade, et d'autre part, les génomes de 31 isolats naturels de l'espèce L. kluyveri. Ces données poseront les fondements d'avancées conceptuelles majeures dans notre compréhension de l'évolution des programmes de réplication de l'ADN et de la recombinaison méiotique, de l'histoire des réarrangements chromosomiques,des mécanismes responsables de la composition nucléotidique des génomes, des bases génétiques de la diversité phénotypique et des barrières de spéciation chez les eucaryotes. Pour atteindre ces objectifs, nous proposons de développer une combinaison unique de Génomique comparative, Génomique fonctionnelle et de Génomique des populations que nous appelons «3G». En s'appuyant sur les avancées récentes dans les technologies d'intégration d'outils et de données, nous développerons un environnement informatique commun qui permettra de gérer et d'exploiter au mieux la grande quantité de données générées par la combinaison 3G.

Coordination du projet

Gilles FISCHER (UNIVERSITE PARIS VI [PIERRE ET MARIE CURIE]) – gilles.fischer@upmc.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Université de Strasbourg UNIVERSITE DE STRASBOURG
UPR3081 CNRS CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE PROVENCE
INRA INSTITUT NATIONAL DE LA RECHERCHE AGRONOMIQUE - CENTRE DE RECHERCHE DE JOUY-EN-JOSAS
UPMC-CNRS UNIVERSITE PARIS VI [PIERRE ET MARIE CURIE]
ISoft ISOFT

Aide de l'ANR 1 278 657 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter