Principes moléculaires et évolutifs gouvernant la régiosélectivité des enzymes – dEEPEN
Comprendre l'évolution des enzymes et prédire leur fonction
Prédire la (les) fonction(s) d'une enzyme est un problème difficile aux retombées biotechnologiques importantes. Ici, nous abordons ce problème en étudiant les mécanismes moléculaires et les propriétés évolutives d’une classe d’enzymes impliquées dans la voix de synthèse de l’ubiquinone. Pour ceci, nous proposons une approche interdisciplinaire en confrontant des analyses bioinformatiques d’évolution, des modèles biophysiques de dynamique moléculaire et des expériences de biochimie.
Modélisation moléculaire, phylogénomique et analyses de coévolution pour élucider le fonctionnement et l’évolution des hydroxylases de la voix de synthèse de l'ubiquinone
Notre projet aborde les questions de la prédiction et de la conception des fonctions<br />enzymatiques. Pour ceci, nous étudions une famille d’hydroxylases (les monooxygénases à<br />flavine, FMO) capables d’effectuer leur réaction (une hydroxylation) à différentes positions du<br />cycle aromatique de l’ubiquinone (UQ), molécule clef de la chaîne respiratoire. En particulier, la<br />famille des UQ-FMOs se caractérise par une grande diversité de régiosélectivité, c’est-à-dire<br />d’enzymes pouvant hydroxyler une, deux ou trois positions du cycle aromatique de l’UQ.<br /><br />Notre objectif est d’élucider les mécanismes moléculaires responsables de cette diversité de<br />régiosélectivité en combinant modélisation moléculaire, phylogénomique et analyses statistiques de coévolution des résidus. En outre, nous testerons systématiquement les régiosélectivités prédites d’enzymes naturelles, artificielles et ancestrales (enzymes que nous ressusciterons) à l’aide d’expérience de biochimie.<br /><br />Notre analyse des régiosélectivités des FMOs est effectuée suivant une approche hiérarchique,<br />i.e., en partant d’une sous-famille des UQ-FMOs spécifique des alphaprotéobactéries (les UbiL)<br />et en étudiant progressivement l’ensemble des UQ-FMOs puis des FMOs. Plus spécifiquement,<br />un de nos objectifs est d’identifier le(s) groupe(s) de résidus responsable(s) des variations de régiosélectivités des FMOs, et qui sont attendus sous la forme de «secteurs« ou de «specificity-determining positions« discutés dans la littérature. Nous utiliserons alors cette information pour refactoriser les fonctions enzymatiques. Comme preuve de concept de la généralité de notre méthodologie, nous chercherons à modifier la régiosélectivité d’une FMO non associée à la voie de l’UQ.
Méthodes développées:
A. Bioinformatique - analyses évolutives des enzymes:
A.1. Développement d’un outil bioinformatique intégrant les diverses méthodes d’analyse de coévolution des résidus dans les protéines et de pondération statistiques disponibles dans la littérature. Application de ces analyses aux UbiL et aux autres UQ-FMOs.
A.2. Elaboration d’un scénario robuste et précis d’évolution des UbiL sur la base d’une reconstruction phylogénomique de ~3000 séquences disponibles dans les bases de données du NCBI. L’extension à l’ensemble des UQ-FMOs est en cours.
B. Biochimie - test expérimental des fonctions des enzymes:
B.1. Nous avons testé expérimentalement les régiosélectivités de plus de 130 UQ-FMOs dont 80 UbiL à l’aide de tests de complémentation fonctionnelle.
C. Modélisation moléculaire:
C.1. Développement d’un pipeline de modélisation automatisé, prenant en compte l’organisation multi-domaines des protéines de la famille des FMO. Le pipeline a été utilisé pour modéliser 10 UbiL de 5 organismes d’intérêt pour l’analyse évolutive, et dont les régiosélectivités ont été évaluées expérimentalement.
C.2. Modélisation de dynamique moléculaire des UbiL en complexe avec la flavine adénine dinucléotide (FAD, cofacteur de la réaction) et 3 substrats possibles. Le mode de liaison au substrat et au FAD a été étudié en détail pour chacune des enzymes et en comparaison avec la PHBH (structure de référence des FMO de classe A).
C.3. Comparaison de la flexibilité moléculaire des UbiLs par une approche combinant dynamique moléculaire et analyse par Protein Blocks
C.4. Prédiction des SDP de UbiL basée sur une analyse comparative du site de liaison au substrat.
Nous avons établi une carte exhaustive des variations de fonctionnalité d’une classe d’enzymes (les UbiL) au sein d’une classe de bactéries vieille d’approximativement 2 milliards d’années (les alpha-protéobactéries). Combinée à nos analyses fines de phylogénomique et nos analyses de coévolution des résidus, ces données permettent non seulement d’avoir une connaissance précise fine des évènements liés à l’émergence et l’évolution d’une fonction enzymatique (ici l’hydroxylation du cycle aromatique de l’UQ) mais suggèrent également un scénario précis pour une partie de l’arbre des espèces pour laquelle il existe une controverse au sein de la communauté des phylogénéticiens.
Nous avons identifié à l’aide de la modélisation moléculaire six résidus importants en interaction avec le substrat (intermédiaire de l’UQ). Remarquablement, cinq de ces six résidus appartiennent à un des secteurs identifiés par les méthodes de coévolution. Ces résultats font ainsi pour la première fois le pont entre détails mécanistiques de la régiosélectivité et traces évolutives observables dans les séquences.
Concernant le scénario d’évolution des UQ-FMOs: publication d’un article intégrant les analyses phylogénomiques et les résultats expérimentaux qui proposera l’histoire évolutive de la régiosélectivité au cours de l’évolution des UQ-FMOs depuis l’ancêtre des Protéobactéries produisant de l’UQ.
Concernant les méthodes d'analyses de coévolution: mise en place d'un logiciel «open source« modulaire combinant les différentes métriques disponibles associées à la coévolution et les différentes ponderations également disponibles. Objectif: comparaison systématique des résultats des différentes méthodes avec une première application chez les FMOs.
Concernant la modélisation moléculaire:
- Modélisation des intermédiaires de réaction avec les UbiL.
- Etude de la régiosélectivité des Ubi intégrant des données de modélisation moléculaire et analyse de séquences (publication en cours de rédaction)
- Etude de la flexibilité et dynamique moléculaires sur la reconnaissance des substrats et FAD chez les FMO de classe A.
Teppa E., Launay R., de Brevern A., Junier I., Abby S., Pierrel F., Esque J., André I. Structural and sequence investigations of regioselectivity and substrate specificity in a family of enzymes: the case study of ubiquinone biosynthesis hydroxylases. Journées du GDR Bioinformatique Moléculaire, GT MASIM, November 25-26 2021, Lyon.
Launay R., Teppa E., Martins C., Abby S., Pierrel F., André I, Esque J. Characterization and functional comprehension of an enzymatic assembly: the ubiquinone metabolon from Escherichia coli. Journées du GDR Bioinformatique Moléculaire, GT MASIM, November 25-26 2021, Lyon.
Teppa E., Launay R., Esque J., André I., Enzyme specificity and regioselectivity in flavin-containing monooxygenases. Seminars of the A2B2C April 7, 2021
« A complex scenario of gene duplications and losses explains the evolution of hydroxylases’ regio-selectivity within the ubiquinone biosynthetic pathway » Groupe Français de Bioénergétique (21-24 septembre 2021)
L’exploitation de l’information évolutive, et plus particulièrement de la coévolution des résidus, a révolutionné la prédiction des structures de protéines. L’application des méthodes issues de ces analyses pour la prédiction et la conception de fonctions enzymatiques reste un problème ouvert. Les fonctions enzymatiques sont en effet caractérisées par une dynamique interne des protéines difficile à modéliser et à étudier expérimentalement. Dans ce projet, nous abordons ce problème en étudiant plus spécifiquement la capacité de certaines hydroxylases de la famille des monooxygénases à flavine (FMO) à effectuer leur réaction à différentes positions du cycle aromatique de l’ubiquinone (UQ), molécule clef de la chaîne respiratoire. Plus précisément, la voie de biosynthèse de l’UQ comporte trois réactions d’hydroxylation sur trois atomes de carbone du noyau aromatique de l’UQ. Partenaire 1 a montré que différentes espèces de protéobactéries utilisent différentes combinaisons de (UQ-)FMOs pour hydroxyler ces trois positions, avec des bactéries utilisant une seule enzyme capable d’hydroxyler toutes les positions et d’autres bactéries utilisant trois enzymes hydroxylant chacune une seule position. La famille des UQ-FMOs se caractérise donc par une grande diversité de régiosélectivité, avec des enzymes pouvant hydroxyler une, deux ou trois positions. Dans ce contexte, notre objectif est de proposer une méthodologie intégrant modélisation moléculaire (Partenaire 2) et information évolutive des enzymes (Partenaire 1) afin d’élucider les mécanismes moléculaires responsables de cette diversité.
Nos résultats préliminaires montrent que chez les alphaprotéobactéries, une famille d’enzymes homologues nommée UbiL présente l’ensemble de la diversité des UQ-FMOs, i.e., elles hydroxylent une, deux ou trois positions dans différents organismes. En outre, une analyse de coévolution des acides aminés chez UbiL suggère que cette diversité est contrôlée par un secteur, c’est-à-dire un réseau de résidus coévoluant connectés dans l’espace 3D (formant une cavité autour du site actif). Dans ce contexte, notre travail visera, premièrement, à disséquer les mécanismes moléculaires responsables de la variation de la régiosélectivité de UbiL. Pour ceci, nous utiliserons une combinaison de modélisation moléculaire (Partenaire 2), de phylogénomique (Partenaire 1) et d’analyses statistiques de coévolution des acides aminés (Partenaire 1). En outre, les régiosélectivités prédites d’enzymes naturelles, artificielles et ancestrales (enzymes que nous ressusciterons) seront systématiquement testées à l’aide d’expérience de biochimie (Partenaire 1). Dans un deuxièmement temps, nous appliquerons notre méthodologie à l’ensemble des UQ-FMOs (~1000 séquences) afin d’éclairer l’évolution des mécanismes d’hydroxylation de la voie de l’UQ. Enfin, nous traiterons l’ensemble des FMOs (~18000 séquences) afin de retracer l’évolution de cette famille de protéines en identifiant les points communs et différences entre voies métaboliques. En particulier, notre objectif est d’identifier le(s) secteur(s) responsable(s) des variations de régiosélectivités des UQ-FMOs et, plus généralement, des FMOs et d’utiliser cette information pour refactoriser les fonctions enzymatiques. Comme preuve de concept de la généralité de notre méthodologie, nous chercherons alors à modifier la régiosélectivité d’une FMO non associée à la voie de l’UQ.
En résumé, ce projet interdisciplinaire vise à intégrer modélisation moléculaire (allant de la modélisation 3D des enzymes à l’analyse de la dynamique interne lors de l’interaction enzyme-substrat) et information évolutive (allant de la reconstruction de l’histoire évolutive des voies métaboliques à la coévolution des acides aminés) d’enzymes dont nous pouvons tester biochimiquement la fonctionnalité afin d’améliorer notre compréhension générale de l’évolution des fonctions enzymatiques et de proposer, in fine, des nouveaux principes de conception.
Coordination du projet
Ivan JUNIER (Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
TIMC-IMAG Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble
LISBP LABORATOIRE D'INGÉNIERIE DES SYSTÈMES BIOLOGIQUES ET DES PROCÉDÉS
Aide de l'ANR 447 191 euros
Début et durée du projet scientifique :
février 2020
- 42 Mois