Reconnaissance de pli et repliement inverse: vers une prédiction à grande échelle des structures de protéines – PROTEUS
La séquence d'acides aminés d'une protéine détermine sa structure 3D et, à travers celle-ci, sa fonction biologique. Si les projets de séquençage de génomes ont élucidé des millions de séquences protéiques, seules ~30.000 structures 3D sont connues. Des méthodes de modélisation « par homologie » prédisent la structure 3D à partir de la séquence d'acides aminés, en s'appuyant sur la similarité (ou « homologie ») avec une autre séquence, de structure 3D connue. C'est le problème classique (mais difficile) de reconnaître le « pli », ou structure 3D, au sein d'une bibliothèque de plis possibles. Une approche complémentaire consiste à renverser ce problème, et poser le problème du repliement inverse: identifier les séquences les plus favorables correspondant à une structure 3D, ou « pli » donné. Nous résoudrons ces deux problèmes, reconnaissance du pli et repliement inverse pour un échantillon complet de structures. Nous prédirons le pli de toutes les protéines bactériennes dont la structure n'est pas encore connue (300.000 protéines). Nous résoudrons le problème du repliement inverse pour 1300 plis, parmi les 2300 recensés aujourd'hui (dans la bibliothèque SCOP), en poussant à ses limites la technique émergente de l'évolution dirigée. Celle-ci mime l'évolution naturelle pour résoudre un problème extrêmement difficile d'optimisation combinatoire. Les structures prédites permettront de prédire la fonction de milliers de nouvelles protéines.
Coordination du projet
Organisme de recherche
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Aide de l'ANR 484 057 euros
Début et durée du projet scientifique :
- 36 Mois