CE30 - Physique de la matière condensée et de la matière diluée

Déchifrer les contraintes évolutionnaires sur les séquences d'ARN: des modèles physiques à la conception. – DECRyPteD

Résumé de soumission

Les ARN non codants jouent plusieurs rôles fondamentaux dans la cellule, en particulier dans les processus catalytiques et de régulation. Une question fondamentale est de savoir comment la séquence d’une molécule d' ARN code pour sa structure, c’est-à-dire le repliement dans une conformation 3D, et sa fonction, par exemple comment elle interagit avec d'autres molécules. Ce projet vise à répondre à cette question en développant des modèles statistiques inférés à partir des données de séquences d’ARN collectées dans des organismes différents. Ces ARN ont évolué depuis des centaines de millions d’années à partir d’un ancêtre commun, tout en conservant leur fonction et leur structure. Il est donc crucial de pouvoir caractériser précisément la diversité des séquences et de comprendre comment celles-ci codent pour les contraintes structurelles, fonctionnelles et évolutionnaires auxquelles sont soumis ces ARN.
Dans le cadre de DECRyPTeD, nous développerons des approches théoriques et computationnelles innovantes, inspirées de la physique statistique et de l’apprentissage machine non-supervisé, pour modéliser et exploiter les données massives de séquences. Les modèles seront utilisés pour (i) prédire les structures tertiaires (natives et/ou associées aux changements allostériques) et les contacts transitoires lors du repliement; (ii) identifier les motifs de nucléotides dans la séquence contrôlant ses fonctionnalités (activité, spécificité, ...) ; (iii) synthétiser de nouvelles séquences d’ARN ayant une structure donnée et une spécificité pour un ligand particulier ; (iv) prédire l’évolution d’une population de séquences ayant une spécificité initiale donnée et contraintes à acquérir une spécificité différente.
Cette approche de modélisation sera validée par des calculs in silico et également expérimentalement. Du point de vue computationnel, nous inférerons des modèles à partir de distributions de séquences artificielles ayant des structures de complexités croissantes et testerons la capacité de ces modèles à produire de nouvelles séquences ayant les mêmes propriétés structurelles. Du point de vue expérimental, nous utiliserons (i) des méthodes de sondage chimique (SHAPE, DMS) qui permettent d’accrocher des marqueurs sur les bases non appariées des molécules d’ARN (naturels ou synthétisés à partir des modèles) et donc d’en déterminer la structure ; (ii) des techniques d'évolution dirigée (SELEX), qui permettent de sélectionner, parmi une large populations de molécules, celles qui ont une affinité suffisante pour une cible donnée (ligand) et donc de faire évoluer une famille de séquences d’ARN afin d’en modifier la spécificité.
Ce projet est à la fois fondamental et appliqué. Il vise d’une part à développer et à évaluer des approches de modélisation quantitative, au croisement de la physique statistique et de l’apprentissage machine, qui soient à la fois contrôlées et interprétables, et d’autre part à développer le contrôle et la conception d’ARN non codant dans un but appliqué. Les applications médicales comprennent en effet le développement de nouveaux médicaments antibactériens, de technologies d'édition du génome et de techniques d’immunothérapie contre le cancer.
DECRyPTeD est porté par trois équipes provenant de différentes communautés (physique statistique, informatique et bioinformatique, biologique computationnelle, biochimie et biologie de l'évolution). Ce projet permettra aussi de renforcer les coopérations entre ces disciplines dans le cadre de conférences et de réunions favorisant une approche et une vision interdisciplinaire de la recherche en France.

Coordinateur du projet

Madame Simona COCCO (Laboratoire de physique de l'ENS)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LPENS Laboratoire de physique de l'ENS
LIX Laboratoire d'Informatique de l'Ecole Polytechnique
UPDESCARTES -UMR 8038 Cibles Thérapeutiques et Conception de Médicaments

Aide de l'ANR 400 227 euros
Début et durée du projet scientifique : septembre 2019 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter