Apprentissage automatique au service de l’ingénierie métabolique – MEM
Apprentissage automatique au service de l’ingénierie métabolique
Dans le but de rationaliser les pratiques R&D en ingénierie métabolique nous proposons de développer un cycle automatisé de conception, construction, caractérisation et apprentissage de voies de biosynthèse. Le cycle est générique, il est illustré par la recherche et la biosynthèse d’antimicrobiens contre les bactéries à Gram positif.
Un cycle automatisé de conception, construction, caractérit apprentissage de voies de biosynthèse.
Malgré le nombre croissant de molécules bio-produites, le processus de R&D en biotechnologies industrielles est lent et coûteux. Il est essentiellement basé sur une approche empirique essais-erreurs. Dans le but de rationaliser les pratiques R&D MEM propose de développer un cycle automatisé de conception, construction, caractérisation et apprentissage de voies de biosynthèse. <br /><br />Le cycle MEM comprend des outils de bio-informatique et de chemo-informatique de conception de voies métaboliques, une station robotisée de biologie moléculaire, et un système haut débit de criblage des souches qui utilise des biocapteurs in vivo. L’idée originale du projet MEM est de piloter le cycle par un apprentissage automatique supervisé. La méthode spécifique que nous proposons d’utiliser est l’apprentissage actif dont le but est de déterminer les expériences devant être menées à l’itération suivante en fonction des résultats expérimentaux obtenus à l’étape précédente. L’apprentissage actif est aussi performant que des méthodes plus classiques tout en utilisant beaucoup moins de données d’apprentissage, la méthode permet ainsi de réduire substantiellement le nombre d’itérations et au final les nombres de constructions et d’acquisitions de données expérimentales.<br /> <br />Nous proposons d’utiliser le cycle pour la production de flavonoïdes (et notament les précurseurs ponocembrine et naringenine), des additifs alimentaires ayant aussi des activités antibactériennes. <br /><br />La production de flavonoïdes par biosynthèse a d’ores et déjà fait l’objet de plusieurs études mais la plupart de celles-ci démontrent qu’il existe des goulets d’étranglements qui réduisent fortement le rendement. Notre challenge est donc de retirer ces goulets afin de maximiser la production. <br /><br />Nous anticipons que notre cycle apportera une rupture technologique dans la pratique des biotechnologies industrielles, permettant un gain substantiel en débit, tout en réduisant les temps et coûts de développement.<br />
Notre programme est composé de quatre tâches scientifiques et de deux activités annexe (management et exploitation). Les tâches scientifiques sont les quatre étapes du pipeline MEM : « Design, Build, Test, Learn ». Les tâches scientifiques sont appliquées à quatre objectifs de recherche, qui utilisent le pipeline pour la bioproduction de flavonoïdes chez E. coli.
Le premier objectif (RO1) est d’apprendre les séquences enzymatiques permettant de maximiser la production de flavonoïdes. Le second objectif (RO2) est de déterminer le niveau d’expression des enzymes via les sequences enzymatique les sequences des promoteurs et des sites de fixation du ribosome de façon à éliminer accumulation de produits intermédiaires. Pour éviter le fardeau de charge du plasmide, l’objectif RO3 est d’insérer les meilleurs constructions plasmidiques dans le génome d'E. coli
Les souches les plus performantes de RO3 seront ensuite utilisées pour produire de multiples flavonoïdes sélectionnés pour leurs activités antibactériennes (RO4).
Le pipeline sera à nouveau utilisé, cette fois pour identifier et insérer des enzymes hétérologues spécifiques produisant des composés à partir de la pinocembrine et de la naringenine. Leurs activités antibactériennes seront mesurées à l'aide d'un test de toxicité contre B. subtilis. Les mesures de toxicité seront utilisées pour apprendre une relation structure-activité permettant une prédiction de la toxicité à partir de structures chimiques. Les composés, hautement toxiques pour B. subtilis et présentant une faible toxicité pour E. coli (comme prévu par notre relation structure-activité), seront sélectionnés pour le cycle suivant.
Comme prévu dans le programme initial, au cours de la première période de 18 mois nous nous sommes focalisé sur la production de deux molécules précurseurs de la plupart des flavonoïdes : la pinocembrine et la naringenine.
Sur chacune des taches (Design, Build, Test et Learn) nous avons complété les livrables suivants:
- Nous avons développé le workflow RetroPath2.0, un flux de travail « open source » automatisé pour la rétrosynthèse basé sur des règles de réaction généralisées qui effectuent la recherche de voie de rétrosynthèse d’une cible vers un châssis. Nous avons montré à travers plusieurs exemples l'application du workflow aux problèmes biotechnologiques pertinents, y compris l'identification d'autres voies biosynthétiques par la promiscuité enzymatique chez les flavonoïdes.
- Nous terminons le développement d'une librairie combinatoire pour la production de pinocembrine et naringenine ou nous avons modifié, les séquences enzymatiques des voies, les promoteurs et les séquences des sites de fixation du ribosome. Ces librairies ont aussi nécessité le développement de méthode de criblage, et nous avons développé deux biocapteur permettant de quantifié un intermédiaire (le malonyl-CoA) et les produits finaux pinocembrine et naringenine.
- Nous avons développé et validé des biocapteurs d’intermédiaires (tyrosine et malonyl-CoA) et des produits finaux des voies de production de la pinocembrine et de la naringenine.
- Nous avons développé une nouvelle méthode d'apprentissage automatique permettant la recherche de séquence enzymatiques catalysant une réaction métabolique donnée. Notre méthode est basée sur un processus Gaussien qui donnent une estimation de la variance autour des prédictions et offrent ainsi une interprétation probabiliste claire.
Le projet MEM est un projet de 4 ans. Malgré le changement d’affectation du coordinateur (de l’unité iSSB vers l’unité MICALIS) qui a induit un retard dans la mise à disposition des fonds le projet n’a pas pris de retard dans ses jalons scientifiques, et nous n’anticipons de retard dans nos futures jalons.
Alors que le projet est illustré par la construction d’une librairie de flavonoïdes, le cycle « conception-construction-caractérisation-apprentissage » est générique et peut être appliqué à d’autre molécules d’intérêts pour divers secteurs industriels, pour des substances de base ou pour des molécules de chimie fine et de spécialité. Par exemple, le cycle pourra être directement utilisé pour le développent de tout produit biologiquement actif tant qu’un crible d’activité est disponible.
Au-delà de la bioproduction de molécules, le cycle permet aussi être utile pour réaliser l’ingénierie de voies de dégradation de nutriments commercialement attractifs, ou pour le développent de biocapteurs de polluants environnementaux (voir Delépine B, Libis V, Carbonell P, Faulon JL. SensiPath: computer-aided design of sensing-enabling metabolic pathways. Nucleic Acids Res. 8; 44:W226-31, 2016)
L’expertise que nous accumulerons dans la pratique du projet MEM permettra au partenaire ABOLIS d’améliorer substantiellement sa plateforme de développent de souches. En retour, ABOLIS introduira la technologie MEM sur le marché des biotechnologies industrielles et sera proactif dans la recherche et l’acquisition de contrats public-privé.
A terme, la tache « exploitation » permettra la commercialisation de projets pilotes utilisant la technologie MEM. En effet les interactions qu’ABOLIS entretient avec plusieurs grands groupes industriels montrent d’ores et déjà le besoin d’utiliser un cycle tel que celui que nous proposons pour la biosynthèse de produits actifs. Ce service que nous apporterons à l’industrie sera source de revenus et créateur d’emplois.
Publications
1. Delépine B, Libis V, Carbonell P, Faulon JL. SensiPath: computer-aided design of sensing-enabling metabolic pathways. Nucleic Acids Res. 8; 44:W226-31, 2016
2. Carbonell P, Gök A, Shapira P, Faulon JL. Mapping the patent landscape of synthetic biology for fine chemical production pathways. Microb Biotechnol. (5): 687-95., 2016
3. Libis V, Delépine B, Faulon JL. Sensing new c hemicals with bacterial transcription factors. Curr Opinion Microbiol. 33: 105-112, 2016.
4. Delépine B, Duigou, T, Carbonell P, Faulon JL. RetroPath2.0: a retrosynthesis workflow for metabolic engineers, submitted 2017
Présentations
1. Faulon, J.L., WISBI Synthetic Biology conference, University of Warwick, March 2016.
2. Trabelsi, H., Libis, V. Jacry, C, Sieskind, R. Faulon, J.L. Congrès GDR BioSynSys, Bordeaux, June 2016.
3. Delepine B, Duigou, T., Carbonnel, P. Faulon, J.L., Congrès GDR BioSynSys, Bordeaux, June 2016.
4. Libis, V., Delepine, B. Faulon, J.L. SEED (Synthetic Biology, Engineering, Evolution&Design), Chicago, IL, USA, July 18-21, 2016.
5. Faulon, J.L., Centre for Synthetic Biology & Innovation & Department of Life Sciences, Seminar series, Imperial College, London, July 2016.
6. Faulon, J.L., 3rd Synthetic Biology Congress, 20th-21st October 2016, London, UK
7. Faulon, J.L., ET/SynbiCITE Engineering Biology Conference 13-15 December 2016, London, UK.
9. Faulon, J.L., UPHAR Natural Products Meeting, Paris, May 22, 2017.
10. Delepine, B., Duigou, T., Carbonnel, P. Faulon, J.L., SB7.0 (Synthetic Biology 7.0), Singapore, June 2017.
Malgré le nombre croissant de molécules bio-produites, le processus de R&D en biotechnologies industrielles est lent et coûteux. Il est essentiellement basé sur une approche empirique essais-erreurs. Dans le but de rationaliser les pratiques R&D nous proposons de développer un cycle automatisé de conception, construction, caractérisation et apprentissage de voies de biosynthèse. Le cycle est générique, il et sera illustré par la recherche et la biosynthèse d’antimicrobiens contre les bactéries à Gram positif.
Notre pipeline comprend des outils de bio-informatique et de chemo-informatique de conception de voies métaboliques, une station robotisée de biologie moléculaire, et un système haut débit de criblage des souches qui utilise des biocapteurs in vivo. L’idée originale du projet MEM est de piloter le cycle par un apprentissage automatique supervisé. La méthode spécifique que nous proposons d’utiliser est l’apprentissage actif dont le but est de déterminer les expériences devant être menées à l’itération suivante en fonction des résultats expérimentaux obtenus à l’étape précédente. L’apprentissage actif est aussi performant que des méthodes plus classiques tout en utilisant beaucoup moins de données d’apprentissage, la méthode permet ainsi de réduire substantiellement le nombre d’itérations et au final les nombres de constructions et d’acquisitions de données expérimentales.
Nous anticipons que notre cycle apportera une rupture technologique dans la pratique des biotechnologies industrielles, permettant un gain substantiel en débit, tout en réduisant les temps et coûts de développement.
Nous proposons d’utiliser le cycle pour la production de flavonoïdes, des additifs alimentaires ayant aussi des activités antibactériennes. Le cycle sera itéré pour quatre objectifs de recherche. Le premier objectif est d’apprendre les séquences enzymatiques permettant de maximiser la productivité des flavonoïdes. Le second objectif est de déterminer le niveau d’expression des enzymes des voies de biosynthèse de façon à éliminer l’accumulation de produits intermédiaires. Le troisième objectif est d’apprendre à réguler les gènes de la souche châssis pour optimiser à la fois sa croissance et la productivité des produits finaux. Le dernier objectif est de produire de nouvelles structures de flavonoïdes ayant une toxicité maximale contre les bactéries à Gram positif.
Alors que le projet sera illustré par la construction d’une librairie de flavonoïdes, le cycle « conception-construction-caractérisation-apprentissage » est générique et peut être appliqué à d’autre molécules d’intérêts pour divers secteurs industriels, pour des substances de base ou pour des molécules de chimie fine et spécialisée. Par exemple, le cycle pourra être directement utilisé pour le développent de tout produit biologiquement actif tant qu’un crible d’activité est disponible. Au-delà de la bioproduction de molécules, le cycle pourrait aussi être utile pour réaliser l’ingénierie de voies de dégradation de nutriments commercialement attractifs, ou pour le développent de biocapteurs de polluants environnementaux.
L’expertise que nous accumulerons dans la pratique du projet MEM permettra au partenaire ABOLIS d’améliorer substantiellement sa plateforme de développent de souches. En retour, ABOLIS introduira la technologie MEM sur le marché des biotechnologies industrielles et sera proactif dans la recherche et l’acquisition de contrats public-privé. Une tache spécifique « exploitation » sera programmée pour permettre la mise en ligne de certains de nos outils logiciels et pour la commercialisation de projets pilotes utilisant la technologie MEM. En effet les interactions qu’ABOLIS entretient avec plusieurs grands groupes industriels montrent d’ores et déjà le besoin d’utiliser un cycle tel que celui que nous proposons pour la biosynthèse de produits actifs. Ce service que nous apporterons à l’industrie sera source de revenus et créateur d’emplois.
Coordinateur du projet
Monsieur Jean-Loup FAULON (Institut de Microbiologie de l’Alimentation au service de la Santé)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
iSSB Institut de Biologie Systémique et Synthétique
MICALIS Institut de Microbiologie de l’Alimentation au service de la Santé
ABOLIS Abolis Biotechnologies
Aide de l'ANR 517 206 euros
Début et durée du projet scientifique :
septembre 2015
- 48 Mois