Identification par Tn-seq de nouveaux déterminants génétiques de bactéries phytopathogènes, impliqués dans l’infection des plantes et la persistance dans l’environnement – TNPHYTO
Identification par Tn-seq de nouveaux déterminants génétiques de bactéries phytopathogènes, impliqués dans l'infection des plantes et la persistance dans l'environnement
Des bactéries d’espèces pathogènes pour les plantes peuvent être isolées dans des environnements variés tels que le sol, l’eau ou des plantes sauvages saines. nous proposons de travailler sur des souches de bactéries phytopathogènes isolées de l’environnement et d’identifier les déterminants génétiques permettant leur croissance et leur survie dans la plante mais aussi dans un substrat environnemental, l’eau de rivière, vecteur majeur de dissémination.
Identification de facteurs de virulence de bactéries phytopathogènes par Tn-seq
Le principal objectif scientifique de ce projet est d'identifier à la fois les gènes communs et les gènes spécifiques impliqués dans la pathogénicité et l'acclimatation à l'environnement de trois groupes de bactéries causant des maladies des plantes en France, le complexe Pseudomonas syringae et les entérobactéries pectinolytiques appartenant aux genres Dickeya et Pectobacterium. Ces bactéries ont été choisies parce qu'elles possèdent différentes stratégies pour l'infection des plantes, mais elles partagent des propriétés concernant leur écologie et leur capacité à survivre en dehors des environnements agricoles, par exemple dans les eaux douces telles que les rivières. Dickeya et Pectobacterium provoquent des pourritures molles sur une large gamme de plantes, y compris des plantes d'importance agronomique. Ces dernières années, de nouvelles espèces émergentes ont été identifiées, telles que D. solani et P. parmentieri. Elles sécrètent, par l'intermédiaire d'un système de sécrétion de type II (T2SS), des enzymes dégradant la paroi cellulaire des plantes, qui détruisent l'intégrité des tissus végétaux et entraînent la mort des cellules. P. syringae représente l'archétype des bactéries qui utilisent un système de sécrétion de type III (T3SS) pour injecter des effecteurs bactériens dans la cellule végétale afin de déjouer le système immunitaire de la plante et d'accéder aux nutriments. Pour ces organismes modèles, d'autres facteurs de pathogénicité ont été signalés et peuvent varier d'une souche à l'autre. La technique que nous avons utilisée est le Tn-seq, une technique innovante de mutagénèse couplée au séquençage haut débit choisie pour identifier rapidement, sur un large panel de souches, des gènes nécessaires à la croissance dans une condition donnée, ici la plante ou l’eau. Cette étude est effectuée sur des souches de Dickeya, Pectobacterium et Pseudomonas syringae, toutes capables de se développer sur une large gamme d’hôtes ainsi que dans l’eau, ce qui permet une identification la plus complète possible de gènes d’intérêt. Un autre axe de cette ANR est le développement d’un pipeline bioinformatique complet, permettant de traiter les données obtenues à la fois dans des conditions multiples et pour des souches d’espèces différentes. Les résultats obtenus nous aideront à prédire la virulence des souches et/ou à développer des stratégies antibactériennes. De façon générale, ce projet ouvre la voie à des études d’autres agents pathogènes environnementaux en proposant un cadre original, à la fois conceptuel et technologique, extrêmement prometteur.
La 1ère tâche était de déterminer les souches bactériennes que nous allions utiliser dans nos criblages Tn-seq dans les plantes et dans l’eau de rivière. Pour cela, elles devaient remplir plusieurs critères : 1- Être hautement mutagénisable ; 2- Être capable de se multiplier dans les mêmes plantes hôtes ; 3- Être capable de se multiplier in vitro dans le même milieu de culture. Les 1??? mois ont consisté à sélectionner, parmi une collection de souches de Dickeya, Pectobacterium et P. syringae, les souches qui remplissaient ces critères. Lorsque nécessaire, les ADN de ces souches ont été préparés par le partenaire 3 et envoyés à la fois au séquençage Illumina et Nanopore. Les séquences codantes de génomes complets ont été prédites à l'aide du serveur RAST et la table des gènes orthologues obtenue avec le logiciel Oma v.2.4.2 transmise au partenaire 4 . En parallèle, les banques de mutants des 9 souches sélectionnées ont été préparées, puis les librairies Tn-seq séquencées en duplicat par la plateforme MGX à Montpellier . Les banques de mutants sont toutes de bonne qualité,et ont donc pu être utilisées pour les cribles génétiques in vivo, dans les plantes et dans l’eau de rivière.
En parallèle de la fabrication des banques de mutants, nous avons évalué l’utilisation de la fêve (Partenaire 3) et du melon (Partenaire 2) en milieu contrôlé, comme hôtes communs pour la multiplication des 9 souches bactériennes. Sur la fève, elles se sont toutes montrées capables de se multiplier après injection dans une blessure de la tige. Concernant les plantules de melon, le partenaire 2 a constaté que les souches de Dickeya et de Pectobacterium ne produisent pas de multiplications suffisamment importantes dans cette plante, contrairement aux souches de P. syringae. La laitue testée comme plante de remplacement ne s’est pas révélée adéquate pour notre projet. La fève a été retenue comme seule plante testée.
Concernant les tests en eau de rivière, les partenaires 2 et 3 ont récupéré 100 litres d'eau de Durance qui ont été filtrés et autoclavés pour les expériences de croissance. La concentration en carbone a été déterminée et d'autres mesures (nitrate, nitrite, phosphate, chimie de l’eau) ont été effectuées. L'analyse de la croissance bactérienne dans l'eau de Durance récupérée a été étudiée par les Partenaires 2 et 3.
Concernant l'analyse des données, le partenaire 4 a jeté les bases d'un pipeline bioinformatique qui identifie à partir des données brutes de séquençage les gènes essentiels et conditionnellement essentiels, visualise et compare les résultats entre souches. Ce développement est réalisé en Python, R, shiny et docker. Il a permis d’ores et déjà de traiter les premiers jeux de données. Plusieurs gènes impliqués dans la virulence sur plante ou dans la croissance dans l’eau ont été identifiés. La construction de mutants dans ces gènes permettra de valider les résultats du Tnseq.
Développement de TnSEEK
Le partenaire 4 a conçu TNSEEK, un pipeline bioinformatique pour identifier les gènes essentiels et conditionnellement essentiels à partir des données brutes de séquençage. Développé avec Python, R, Shiny et Docker, il permet également de visualiser et de comparer les résultats entre différentes souches. TNSEEK a été utilisé pour analyser les premiers jeux de données et sera amélioré en fonction des retours obtenus.
Choix des souches et séquençage
Nous avons sélectionné des souches clés pour les criblages Tn-seq dans les plantes et l’eau de rivière : P. aquaticum A212, P. versatile A73, D. fangzhongdai B16 et D. parazeae A586. Ces nouvelles souches complètent un panel déjà établi. Le séquençage des génomes avec les technologies Illumina et Nanopore a permis de prédire les séquences codantes.
Des banques de mutants pour neuf souches ont été créées, avec des librairies Tn-seq séquencées en duplicat par la plateforme MGX . La densité d’insertion des transposons dans les sites TA varie de 36,8 % à 69,8 %, garantissant une bonne couverture. Ces analyses ont identifié les gènes essentiels, validant ainsi TNSEEK pour explorer les génomes essentiels au sein de genres ou familles proches. Ces génomes montrent des similitudes avec celui d’Escherichia coli.
Tests sur plante
Les banques de mutants ont été utilisées pour infecter la fève, seule plante pouvant héberger les neuf souches étudiées. Après quelques jours, les populations bactériennes dans les tissus végétaux atteignent 10? à 10¹¹ cellules, permettant une analyse robuste des banques Tn-seq. L’analyse a révélé des gènes impliqués dans la virulence, certains communs aux trois espèces bactériennes, d’autres spécifiques à une souche donnée. Ces résultats sont en cours de validation par construction des mutants correspondants. Un point clé concerne le petit ARN arcZ, identifié comme essentiel pour la colonisation. Chez D. solani, un mutant ?arcZ a montré une virulence réduite et une perte de capacité à inhiber les microorganismes compétiteurs. ArcZ régule également les métabolites secondaires (Brual et al., 2023), mettant en lumière son rôle central dans la virulence et la compétition inter bactérienne.
Tests dans l’eau
Une analyse génomique a conduit à la description de P. quasiaquaticum, une nouvelle espèce distincte de P. aquaticum sur des bases génomiques, physiologiques et écologiques (Ben Moussa et al., 2021). Ces espèces aquatiques ont abandonné la niche plante (Ben Moussa et al., 2023). Une étude comparative sur 80 souches a permis de déterminer leur abondance variable en rivière (Ben Moussa et al., 2022). Les résultats Tn-seq montrent l’importance de l’assimilation du phosphate pour la survie de Dickeya et Pectobacterium en milieu aquatique.
Le criblage Tn-seq réalisé dans ce projet a permis d’identifier de nombreux gènes essentiels à la virulence des trois espèces bactériennes étudiées. Parmi ces gènes, plusieurs codent des régulateurs transcriptionnels, qui jouent un rôle central pour toutes les espèces. L’étude approfondie de ces régulateurs constitue une perspective majeure. Nous nous concentrerons sur leurs gènes cibles afin de décrypter les mécanismes moléculaires sous-jacents à leur contribution à la virulence bactérienne.
Concernant ArcZ, un sRNA déjà bien étudié, nous progressons dans la compréhension de son rôle comme régulateur global de la virulence et de la production de métabolites secondaires chez Dickeya solani. Cette fonction semble spécifique à D. solani et absente chez d’autres espèces du genre Dickeya. Une de ses cibles identifiées est conservée dans les Pectobacteriaceae, mais son rôle varie selon les espèces. Pour explorer ces différences fonctionnelles, une étude transcriptomique comparative utilisant RNA-seq sera essentielle. Cela permettra de décrypter les réseaux régulés par ArcZ et d’expliquer la variabilité de son impact au sein de cette famille bactérienne.
Les gènes à fonction inconnue impliqués dans la virulence représentent une part importante des cibles identifiées. Leur rôle précis reste à élucider. Une approche combinant prédictions de structure protéique via AlphaFold et analyses interactomiques jettera les bases pour explorer leur fonction. La modélisation structurale identifiera des similarités avec des protéines connues ou prédira des sites actifs, tandis que l’interactomique révélera leurs partenaires moléculaires, offrant des indices sur leur intégration dans les réseaux biologiques. Ces efforts contribueront à une meilleure compréhension des mécanismes de virulence et pourraient révéler de nouvelles cibles pour des stratégies de lutte.
Certains régulateurs transcriptionnels apparaissent essentiels à la virulence dans certaines espèces mais pas dans d’autres, suggérant des mécanismes de régulation spécifiques à chaque espèce. Une étude comparative par RNA-seq et ChIP-seq identifiera les cibles spécifiques de ces régulateurs et leurs réseaux d’interaction. Bien que non incluse dans les délivrables initiaux de l’ANR, cette analyse s’avère cruciale pour décrypter les mécanismes de virulence propres à chaque espèce et identifier des cibles pour des stratégies innovantes.
Enfin, certains gènes dont l’absence augmente la virulence jouent un rôle clé dans la survie en environnements oligotrophes, tels que l’eau de rivière. Ces résultats soulignent l’importance d’une approche holistique, considérant le pathogène dans ses interactions avec les plantes hôtes et ses habitats naturels. L’exploration approfondie de ces gènes permettra de mieux comprendre l’adaptation bactérienne à divers environnements et d’ouvrir la voie à des stratégies de lutte écologiquement ciblées.
Les bactéries pathogènes des plantes entraînent des pertes de récolte importantes contre lesquelles très peu de moyens de lutte existent. Toutefois, la protection des plantes nécessite la connaissance de la diversité génétique et phénotypique des agents phytopathogènes, l’étendue de leur gamme d’hôtes et la diversité des habitats dans lesquels ils constituent des populations réservoir. Les études sur les bactéries pathogènes des plantes sont bien souvent menées sur un nombre limité de souches de laboratoire et sur des plantes modèles ce qui ne représente que partiellement les situations réelles. En effet, alors que certaines bactéries sont trouvées exclusivement sur des plantes malades, d’autres peuvent être isolées aussi dans des environnements variés tels que le sol, l’eau ou des plantes sauvages saines. Ces souches de l’environnement peuvent représenter une source potentielle d’épidémie mais peu est connu des déterminants potentiellement pathogènes qu’elles portent ni sur comment ces réservoirs jouent un rôle dans leur survie, leur multiplication et leur pouvoir pathogène. Dans la perspective de développer une approche plus globale de l’étude des maladies des plantes incluant l’environnement, nous proposons de travailler sur des souches de bactéries phytopathogènes isolées de l’environnement et d’identifier les déterminants génétiques permettant leur croissance et leur survie dans la plante mais aussi dans un substrat environnemental, l’eau de rivière, vecteur majeur de dissémination. Dans ce projet, la mise en oeuvre du Tn-seq, une technique innovante de mutagénèse couplée au séquençage haut débit a été choisie pour identifier rapidement, sur un large panel de souches, des gènes nécessaires à la croissance dans une condition donnée, la plante ou l’eau. De tels déterminants seront recherchés chez trois bactéries phytopathogènes à large spectre d’hôtes en France, Pseudomonas syringae, Pectobacterium spp et Dickeya spp, pour lesquelles nous disposons de collections de souches environnementales importantes et uniques. Des souches représentant la plus grande diversité phylogénétique seront sélectionnées pour disposer d’un large panel de déterminants potentiels. L’analyse Tn-seq sera effectuée sur plusieurs plantes et dans l’eau de rivière. Pour analyser la grande masse de données générées par ces analyses, nous développerons et diffuserons un pipeline bioinformatique complet, permettant de traiter à la fois des conditions multiples et des souches différentes. La validation des résultats obtenus nécessitera la construction d’un grand nombre de mutants. En plus des techniques de mutation classiques, nous développerons le CrispRi chez ces trois espèces. Toutes ces approches permettront d’identifier, comme cela a été fait chez des pathogènes humains, de nouveaux déterminants génétiques plus ou moins génériques impliqués dans la virulence sur plante, conservés au niveau du genre, de l’espèce ou de la souche. Il conduira également à connaître les gènes nécessaires à la survie dans l'environnement aquatique, très peu connus chez ces espèces environnementales. La comparaison des deux habitats permettra d’envisager comment les réservoirs environnementaux peuvent influencer le pouvoir pathogène des bactéries et en tenir compte dans l’anticipation de futures épidémies. Les résultats obtenus nous aideront à prédire la virulence des souches et/ou à développer des stratégies antibactériennes. De façon générale, ce projet ouvrira la voie à des études d’autres agents pathogènes environnementaux en proposant un cadre original à la fois conceptuel et technologique, extrêmement prometteur.
Coordination du projet
Guy CONDEMINE (MICROBIOLOGIE, ADAPTATION ET PATHOGENIE)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
INRA PACA - PV INSTITUT NATIONAL DE LA RECHERCHE AGRONOMIQUE - Centre de Recherche PACA - Pathologie Végétale
Swiss institute of Bioinformatics / Bioinformatics and proteogenomics
MAP MICROBIOLOGIE, ADAPTATION ET PATHOGENIE
IEES Institut d'écologie et des sciences de l'environnement de Paris
PLBS Centre de Recherche en Informatique, Signal et Automatique de Lille
Aide de l'ANR 516 805 euros
Début et durée du projet scientifique :
février 2020
- 42 Mois