CE07 - Chimie moléculaire et procédés associés pour une chimie durable

Découverte et étude d'amine dehydrogénases par approche in silico – MODAMDH

MODAMDH - Recherche de nouveaux châssis Amines déshydrogénases, des biocatalyseurs reconnus pour un accès par chimie verte aux amines, entités clés en chimie.

Proposer des méthodes bioinformatiques innovantes pour identifier des homologues lointains et des enzymes aux structures variées<br />Dans un contexte international de transition énergétique, la catalyse, et plus particulièrement la biocatalyse qui utilise comme catalyseurs les enzymes, répond aux besoins d'une chimie plus durable. Des enzymes nommées amines déshydrogénases (AmDHs) sont une des solutions de chimie verte pour accéder à une des entités clés des industries chimiques, les amines.

identifier des AmDHs diverses au sein de la biodiversité et ainsi fournir à la communauté des chimistes de nouveaux biocatalyseurs pour la synthèse verte d'amines.

Pour que la biocatalyse soit une alternative plus généralisée à la chimie conventionnelle, il est indispensable de disposer de châssis variés en termes de séquences et de structures. Même si l'ingénierie protéique est une méthode puissante pour évoluer les enzymes selon des critères de performance (stabilité, spectre de substrats, etc.), ces biocatalyseurs mutés n'apportent pas la diversité essentielle pour accéder à tout le potentiel de la biocatalyse. L'essor actuel de l'exploitation des données de (méta)génomique issues de l'exploration des communautés microbiennes permet de disposer d'une ressource gigantesque de biocatalyseurs potentiels. Promouvoir des approches bioinformatiques, pour identifier efficacement les enzymes recherchées au sein de ces quantités de données, est un enjeu majeur.<br />L'objectif du projet MODAMDH est d'accéder à des homologues lointains d’AmDHs aux structures variées, présentant des caractéristiques étendues, par un criblage innovant de la biodiversité. Les AmDHs déjà identifiées ont en effet un spectre de substrat actuellement restreint aux cétones et aldéhydes linéaires aliphatiques < C6 et sont uniquement (S)-stéréosélectives, limitant leur utilisation. Les résultats attendus doivent permettre aussi un essor des méthodes de recherche bioinformatiques au sein de la communauté de biocatalyse.

MODAMDH est un projet innovant combinant bio-informatique, chemo-informatique et biocatalyse pour identifier diverses AmDHs parmi la biodiversité. La combinaison de ces nouvelles méthodologies est encore peu utilisée à des fins de biocatalyse. Les AmDHs natives sont recherchées à la fois par des approches d’analyse de séquences utilisant l'homologie lointaine et par des approches structurales basées sur la topologie 3D des sites actifs. Pour élargir le catalogue des AmDHs, la biodiversité est criblée en utilisant non seulement la base de données généraliste UniProtKB, mais aussi des ressources additionnelles de données génomiques et métagénomiques publiques et internes au Genoscope.
Les différentes étapes sont:
- définition de la famille AmDH de référence, clusterisation, génération de profils de modèles de Markov cachés (HMM) et d'un catalophore (topologie de site actif minimal) pour chaque sous-groupe
- définition du pool d'enzymes NAD(P)-dépendantes à cribler, clusterisation, génération de profils HMM et de modèles structuraux 3D pour chaque famille
- sélection d'homologues lointains suite à la recherche HMM/HMM entre les familles d'enzymes NAD(P)-dépendantes et celles des AmDHs de référence
- identification de nouvelles familles d’AmDHs de structure globale 3D différente sur la base du criblage des catalophores de référence au sein des modèles 3D des familles d'enzymes NADP-dépendantes
- production et tests d'activité in vitro d'enzymes sélectionnées
- approche itérative utilisant les nouvelles AmDHs validées expérimentalement et leur structure résolue.

Le criblage de la biodiversité considérée dans le projet MODAMDH, à savoir 2,6 billion de séquences issues de 8 ressources (méta)génomiques, a permis l'extraction de 20,3 M de séquences de protéines NAD(P)-dépendantes qui ont ensuite été regroupées en 104 734 sous-familles pour lesquelles un profil HMM a été généré. La famille AmDH de référence préalablement constituée (2 011 séquences) a été étendue à 27 282 séquences grâce à l’addition de séquences homologues présentes dans les ressources métagénomiques. Les membres de cette famille AmDH de référence ont été classifiés selon, d’une part, leur séquence (phylogénie : 4 groupes, 4 profils HMM) et, d’autre part, la structure de leur site actif (ASMC : 4 groupes, 4 profils HMM). La comparaison de ces profils HMM avec les profils HMM des protéines NAD(P)-dépendantes a permis d’identifier 27 homologues qui, une fois intégrés aux classifications précédentes, n’ont révélé aucun nouveau groupe phylogénétique ou structural. L’activité AmDH de la séquence présentant l’homologie la plus lointaine avec des protéines connues a été confirmée par test d’activité in vitro, ainsi que celles de 42 enzymes représentatives de la diversité de la famille étendue. Plusieurs AmDHs montrant des spectres de substrats bien plus étendus par rapport aux AmDHs connues en début de projet sont en cours de caractérisation. La recherche d’analogues structuraux n’a pas pu être menée à son terme de par la dynamique structurale complexe des AmDHs lors de la catalyse qui a rendu, au vu des ressources computationnelles disponibles, la recherche de catalophores non appropriée.
Ces résultats ont donné lieu à 2 publications et une publication principale en cours d’écriture dans des journaux à comité de lecture, ainsi qu’à 7 communications dans des congrès scientifiques français et européens.

Le projet MODAMDH a permis une avancée considérable dans la connaissance de l’activité AmDH au sein de la biodiversité, ce qui étend grandement la diversité du portfolio de biocatalyseurs pour la synthèse d’amines. En effet, le spectre de substrats différent de certaines AmDHs identifiées lors du projet et leur très faible homologie avec les précédentes enzymes utilisées ouvrent la porte à de nombreuses applications en synthèse et à des études structurales. De plus, MODAMDH est une base solide pour l’implémentation d’un workflow générique permettant la constitution et l’analyse sous-jacente d’une ressource de familles d’enzymes (projet ESR/EquipEx+ ALADIN) ; MODAMDH reflète ainsi la nécessité de coupler la bionformatique et la biocatalyse dans le but d’étendre les ressources enzymatiques pour la chimie de demain.

- Publication sur les principaux résultats de MODAMDH : en cours d'écriture
- Fossey-Jouenne et al; Front. Catal. ; 2023 ; 3:1105948 ; doi.org/10.3389/fctls.2023.1105948
- Ducrot et al; ChemCatChem ; 2022 ; 14, 22 ; doi.org/10.1002/cctc.202200880

7 communications orales/posters en congrès scientifiques

Dans un contexte actuel de réduction des déchets, la catalyse et plus particulièrement la biocatalyse répondent aux besoins d’une chimie plus durable. La présence d’amines chirales dans de nombreux intermédiaires de synthèse de composés utilisés en pharmacologie, agronomie, ou d’autres industries, justifie la recherche de méthodes biocatalytiques d’accès à ces molécules. Les amines déshydrogénases (AmDHs), catalysant l’amination réductrice asymétrique de cétones par seules utilisations d’une source d’amine peu couteuse, l’ammoniac, et d’un cofacteur régénérable, sont une des solutions les plus prometteuses. La découverte d’AmDHs natives, par le coordinateur du projet MODAMDH et ses collaborateurs, a permis d’assigner les premiers gènes à cette fonction, élargissant ainsi ce panel d’enzymes précédemment restreint aux enzymes modifiées par ingénierie. Pour répondre aux critères de développement des biocatalyseurs dans l’industrie, en particulier leur stabilité, activité, sélectivité, spécificité ou encore spectres de substrats, des nouvelles enzymes sont à trouver. L’exploration des données génomiques et surtout métagénomiques est une des voies d’accès privilégiées pour accéder à des séquences protéiques diverses et donc potentiellement source de caractéristiques enzymatiques variées. Les stratégies basées uniquement sur l’alignement deux à deux de séquences primaires permettent de découvrir de nombreuses enzymes répondant aux besoins mais appartenant généralement à des familles déjà identifiées. Le projet MODAMDH a pour objectif de cribler la biodiversité par deux approches plus novatrices basées sur la recherche d’homologues lointains et de topologies tridimensionnelles de sites actifs au sein de données génomiques et métagénomiques préalablement filtrées. Ceci permettra d’élargir les châssis enzymatiques catalysant l’amination réductrice et d’accéder à des homologues aux structures variées, présentant des caractéristiques étendues, en particulier en termes de spectre de substrat ou de stéréosélectivités complémentaires. L’analyse structurale de l’ensemble des AmDHs validées expérimentalement permettra de proposer des travaux d’ingénierie protéique nécessaires pour favoriser l’utilisation en synthèse de ces biocatalyseurs. Les résultats attendus permettront aussi un essor de ces méthodes de recherche au sein de la communauté de biocatalyse en favorisant d’autant plus les progrès des outils bio-informatiques associés.

Coordination du projet

Carine Vergne-Vaxelaire (UMR 8030/GENOSCOPE/CEA)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

University of York / York Structural Biology Laboratory
UMR 8030/CEA UMR 8030/GENOSCOPE/CEA

Aide de l'ANR 168 680 euros
Début et durée du projet scientifique : mars 2020 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter