Introgression adaptative chez le mil – PEMILADAPT
Au-delà de son importance alimentaire, le choix du mil à chandelles comme modèle d’étude repose sur plusieurs atouts. Cette céréale est l’une des plus tolérantes à la sécheresse, ce qui en fait un système très pertinent pour analyser les mécanismes d’adaptation aux climats extrêmes. De plus, l’existence documentée de flux de gènes entre formes sauvages et cultivées fournit un cadre naturel pour étudier l’introgression et en quantifier les effets évolutifs et agronomiques. Un prérequis essentiel du projet a été l’amélioration du génome de référence, indispensable pour établir un lien robuste entre introgressions et variants structuraux. Nous avons combiné du séquençage de 3eme génération (ONT) et de la cartographie optique afin de produire des assemblages chromosomiques de haute qualité. Cette stratégie a permis d’accroître la continuité et l’ancrage chromosomique du génome, rendant possible l’identification fiable des réarrangements structuraux. L’identification des variants structuraux à l’échelle populationnelle représentait un défi majeur, les approches fondées sur des assemblages individuels complets étant trop coûteuses pour de larges effectifs. Nous avons donc testé et validé une approche alternative basée sur des ACP dites locales, permettant de détecter des régions à très faible recombinaison susceptibles de correspondre à des inversions chromosomiques. Pour établir une cartographie fine de l’introgression, plus de 100 génomes complets ont été séquencés à une profondeur comprise entre 20X et 30X. Les données ont été analysées à l’aide de statistiques classiques de génomique des populations, complétées par des approches de machine learning visant à identifier des patrons atypiques de diversité le long du génome. L’objectif était de générer des simulations démographiques fondées sur l’histoire de la domestication du mil, afin d’entraîner des algorithmes de type Random Forest capables de discriminer différentes signatures évolutives. Cependant, au vu des premiers résultats démontrant l'existence de larges plateaux non recombinants et introgressés, ces approches ne pouvaient être utilisées. La stratégie a alors été réorientée en s’appuyant sur des développements méthodologiques issus d’une thèse co-encadrée dans le cadre d’un projet connexe, afin d’identifier les approches les plus robustes et adaptées à la détection de l’introgression adaptative dans ce système. Enfin, la validation phénotypique et fonctionnelle a reposé sur des études d’association génome–phénotype (GWAS) et sur des essais au champ conduits sur deux années, malgré les contraintes liées à la pandémie de COVID-19 et à l’instabilité politique au Sahel. Les mesures de phénologie et de succès reproducteur ont permis d’évaluer l’impact adaptatif des régions identifiées comme introgressées. L’analyse transcriptomique initialement prévue n’a en revanche pas pu être réalisée, faute de ressources humaines dédiées, ce qui constitue une limite identifiée du projet.
Le projet a conduit à des avancées majeures sur la génomique du mil et, plus largement, des mécanismes d’adaptation des plantes cultivées. Un premier résultat concerne la production d’une nouvelle version du génome de référence du mil, publiée dans G3 (Salson et al., 2023). Par rapport à l’ancienne version, nous avons intégré environ 200 Mb de séquences supplémentaires ancrées au niveau chromosomique. La complétude génique atteint désormais 98,4 % et la proportion de bases inconnues a été réduite de 13 % à moins de 0,3 %. Ce nouvel assemblage constitue un socle déterminant pour l’analyse des variants structuraux et de l’introgression. Sur le plan de la biologie évolutive, le projet a mis en évidence l’existence et la persistance de très vastes régions à faible recombinaison couvrant environ 17 % du génome, résultat publié dans Nature Communications (Salson et al., 2025). Si de telles régions ont été suggérées très récemment chez d’autres espèces, leur prévalence, leur taille exceptionnelle et surtout leur maintien n’avaient jamais été démontrés. Nos analyses montrent que ces régions conservent une diversité génétique élevée malgré un faible taux de recombinaison et une accumulation de variants délétères. Nombre d’entre elles sont maintenues sous sélection positive à l’état hétérozygote, apportant ainsi la première démonstration empirique de la pseudo-overdominance. Ce mécanisme a jusqu’alors uniquement été étayé par des modèles théoriques et des simulations. Un lien étroit entre ces régions et l’introgression a également été établi. L’analyse d’une région sur le chromosome 3 a révélé des haplotypes fortement divergents, issus d’une introgression de parents sauvages. L’un de ces haplotypes introgressés s’est révélé quasi létal à l’état homozygote, mais maintenu dans la population grâce à un avantage sélectif marqué chez les hétérozygotes. Ce cas illustre pour la première fois comment l’introgression sauvage peut générer et entretenir de la diversité adaptative via des mécanismes de pseudo-overdominance. Enfin, nos travaux les plus récents (Duranton et al., en préparation) mettent en évidence une forte hétérogénéité de l’introgression dans le génome cultivé, caractérisée par des « déserts » et des « îlots » d’enrichissement en fragments sauvages. Deux dynamiques complémentaires émergent : une introgression adaptative localisée, correspondant à l’apport d’allèles bénéfiques spécifiques dans certaines régions, et une introgression compensatoire contribuant à réduire le fardeau génétique dans les régions faiblement recombinantes. Les analyses d’association génomique montrent que les régions impliquées dans le syndrome de domestication, notamment les traits liés à la panicule, restent largement réfractaires à l’introgression. À l’inverse, les régions associées à la réponse aux stress environnementaux présentent un enrichissement en segments introgressés, confirmant le rôle des parents sauvages comme levier potentiel de résilience climatique.
Le projet PEMILADAPT a profondément renouvelé la compréhension de l’adaptation du mil en mettant en évidence le rôle central de l’introgression sauvage et de la pseudo-overdominance dans le maintien de la diversité génomique. Ces résultats ouvrent plusieurs perspectives scientifiques et appliquées pour les années à venir. Une première perspective concerne le développement d’une approche pan-génomique intégrative. Les analyses menées ont souligné les limites d’un génome de référence unique pour capturer la diversité structurale du mil, notamment les inversions et délétions. La construction d’un pan-génome intégrant à la fois les compartiments sauvages et cultivés permettrait d’identifier des allèles aujourd’hui absents des références disponibles et de mieux caractériser certaines régions du génome, en particulier les régions péricentromériques fortement hétérozygotes où la POD semble particulièrement active. Une seconde direction vise à approfondir la génomique fonctionnelle des régions introgressées. Le projet a permis d’identifier plusieurs segments génomiques d’origine sauvage associés à des traits liés à la fitness, tels que la floraison ou le tallage. Les mécanismes moléculaires sous-jacents restent toutefois à préciser. Des analyses transcriptomiques, notamment via RNA-seq sur des hybrides réciproques, permettraientt d’explorer le rôle du polymorphisme cis-régulateur et de tester l’hypothèse selon laquelle l’adaptation pourrait reposer en partie sur des modifications de l’expression génique. Par ailleurs, les résultats obtenus ouvrent un champ de recherche important en biologie évolutive. PEMILADAPT fournit une des premières démonstrations empiriques de la pseudo-overdominance dans un système de domestication. Les conditions de son émergence et de sa stabilité restent néanmoins à mieux comprendre. Des travaux futurs devront combiner analyses empiriques et simulations démographiques intégrant flux de gènes, goulots d’étranglement liés à la domestication et structure de la recombinaison. Enfin, ces résultats ouvrent des perspectives pour l’amélioration variétale. Le projet a mis en évidence des régions génomiques à faible recombinaison susceptibles de limiter l’introgression de diversité exogène dans les schémas de sélection. Leur caractérisation permettra d’orienter les stratégies de pré-sélection et d’optimiser l’utilisation de la diversité sauvage dans les programmes d’amélioration du mil, espèce appelée à jouer un rôle croissant dans l’adaptation de l’agriculture aux changements climatiques.
Comprendre comment les espèces s'adaptent est primordial pour maintenir la biodiversité. Le potentiel adaptatif des espèces/populations dépend en grande partie de leur diversité génétique, qui repose soit sur la diversité préexistante, soit sur les mutations de novo. Cependant, dans le cas où les changements environnementaux sont trop rapides, l'apparition de nouvelles mutations pourrait être un processus trop lent pour permettre l’adaptation des populations. Lorsque le flux de gènes entre espèces/populations est suffisamment important pour permettre l’incorporation des nouveaux polymorphismes dans le patrimoine génétique de la population receveuse, on parle d'introgression génétique. Si l'introgression génétique augmente le potentiel adaptatif de la population receveuse, on appelle cela "introgression adaptative" (IA). Malgré l’importance des flux de gènes observés chez de nombreuses espèces, relativement peu d’exemples d’IA ont été recueillies jusqu'à aujourd’hui. Les preuves les plus étonnantes d'IA ont été trouvées entre les humains de Neandertal et notre espèce. En ce qui concerne les plantes cultivées, les espèces sauvages apparentées représentent un réservoir d'adaptations qui pourraient alimenter la diversité génétique des plantes cultivées. Avec les progrès de la génomique, il est devenu évident que le flux de gènes entre les formes cultivées et sauvages, a été beaucoup plus complexe et plus long qu'on ne le pensait auparavant. L'adaptation à l'altitude acquise chez certaines variétés de maïs à partir de populations sauvages est un exemple probant du potentiel adaptatif de l'introgression. Néanmoins, à l'heure actuelle, les preuves concluantes de l'IA sont limitées à un petit nombre de cas. Pour que l'IA ait lieu, il faut d’abord que l'introgression des nouveaux allèles réussisse. Le taux d’introgression dépendra de la perméabilité du génome receveur. A ce jour, cette perméabilité génomique et son hétérogénéité au sein du génome sont encore mal comprises, notamment chez les plantes cultivées. De plus, la plupart des données probantes sur l'IA ont simplement abordé la question au travers des de la sélection de type « hard-selective sweeps », alors que le type « soft-selective sweeps » pourrait être le mode prédominant pour l’adaptation des espèces. L'objectif principal du projet PEMILADAPT est de comprendre comment l'introgression de parents sauvages pourrait favoriser l'adaptation des plantes cultivées. Le projet PEMILADAPT vise à répondre aux questions suivantes :
1) Quelle est la fréquence de l'introgression sauvage et comment est-elle répartie le long du génome cultivé ?
2) Quels modes de sélection (hard vs. soft) agissent sur les allèles introgressés ?
3) Quelles sont les implications fonctionnelles de l'introgression sauvage dans le génome cultivé ?
Pour répondre à ces questions, nous utiliserons le mil à chandelles (Pennisetum glaucum). Le mil à chandelles est la sixième céréale la plus importante au monde et c'est une céréale clé dans les régions arides et semi-arides où il est un aliment de base pour plus de 90 millions de petits agriculteurs. Le mil à chandelles sauvage et cultivé se retrouvent en sympatrie et le flux de gènes entre les deux formes est possible et bien documenté. En saisissant les opportunités offertes par les technologies de pointe que sont le séquençage haut-débit et l'intelligence artificielle, le projet PEMILADAPT devrait être à l'avant-garde des questions de recherche sur l’évolution et l’adaptation des espèces. En plus des connaissances fondamentales que le projet PEMILADAPT produira, PEMILADAPT pourrait avoir des impacts significatifs sur les défis environnementaux mondiaux actuels. La compréhension des forces de sélection et du paysage génomique de l'introgression pourra aider les sélectionneurs à améliorer l'efficacité de leurs stratégies de sélection et ainsi faciliter l’adaptation des variétés futures aux changements climatiques.
Coordination du projet
Cécile Berthouly-Salazar (Diversité, adaptation et développement des plantes)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
DIADE Diversité, adaptation et développement des plantes
CBGP Centre de Biologie pour la Gestion des Populations
CBGP Centre de Biologie pour la Gestion des Populations
Aide de l'ANR 280 280 euros
Début et durée du projet scientifique :
janvier 2020
- 48 Mois