Détermination des facteurs régulant la réplication de l'ADN – RepliLand
La réplication de l'ADN est un processus fondamental du cycle cellulaire. Chez les métazoaires, la réplication commence de manière stochastique à de multiples sites appelés origines de réplication. Les facteurs responsables (a) de la sélection de la localisation des origines de réplication potentielles pendant le licensing des origines en phase G1 et (b) de l’activation de certaines origines durant la phase S, restent largement méconnus. De la combinaison de ces étapes résultent le paysage d'initiation potentiel (PIL). Les expériences révèlent soit le licensing en cartographiant la localisation de protéines liées à la réplication telles que ORC et MCM, soit l’activation effective par la mesure des profils de temps moyen de réplication (TMR) ou de directionnalité de la réplication (DR), ce qui ne permet pas de rendre compte du paysage d'initiation potentiel à cause du phénomène de passivation des origines. L'objectif du projet RepliLand est d'élucider la combinaison complexe de facteurs qui gouverne le PIL chez les métazoaires et, en exploitant ce savoir, développer un outil d'intelligence artificielle (IA) permettant de prédire le PIL à partir d'une quantité limitée de données expérimentales. Un tel outil a le potentiel d'avoir un impact sociétal en santé humaine.
Nous avons développé une méthode pour inférer le PIL à partir de données expérimentales de TMR et DR qui ne sont disponibles que pour un nombre limité de lignées cellulaires, principalement chez l'homme. Nous proposons d'améliorer la résolution de cette méthode et de l'appliquer à toutes les lignées cellulaires disposant des profils de réplication chez l'homme et d'autres espèces. Cela constituera une source d'information unique, à haute résolution sur le processus de réplication. De nombreuses expériences ont montré une grande corrélation entre le paysage épigénétique et la régulation de la réplication. Nous proposons de développer une méthode d’IA basée sur des réseaux neuronaux, entraînés sur les jeux de données que nous aurons extrait, pour inférer les paysages d'initiation potentiel en exploitant la grande variété de données épigénétiques disponibles chez l'homme. Nous étendrons ensuite le domaine d'application à la souris où trois PIL et des profils TMR sont disponibles pour validation, en mettant en oeuvre des techniques d'imputation. Pour généraliser cette méthode d'imputation à d'autres espèces et lignées cellulaires où la quantité de données épigénétiques est moindre, nous étudierons la capacité de généralisation du modèle IA à partir d’une quantité limitée d'information. Une fois montré la robustesse de l'outil pour prédire les PIL dans ces conditions, il pourra être appliqué pour étudier la dérégulation de la réplication de l'ADN dans les cellules cancéreuses, où typiquement les données disponibles sont limitées. Finalement, nous mettrons en oeuvre des techniques IA d’explicabilité sur l’outil de prédiction de PIL afin de découvrir les règles de régulation du programme de réplication de l’ADN chez l’homme et les métazoaires. Nous questionnerons dans quelle mesure les différentes facettes du contexte génomique, de la transcription et de l'état de la chromatine agissent de façon synergiques ou antagonistes, d'une manière directe ou indirecte sur l'initiation de la réplication.
Coordination du projet
Jean-Michel Arbona (CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - INSTITUT DE BIOLOGIE DU DEVELOPPEMENT DE MARSEILLE)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
LPENS LABORATOIRE DE PHYSIQUE DE L'ENS DE LYON
LBMC LABORATOIRE DE BIOLOGIE ET MODELISATION DE LA CELLULE
CNRS DR 12 - IBDM CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - INSTITUT DE BIOLOGIE DU DEVELOPPEMENT DE MARSEILLE
Aide de l'ANR 515 664 euros
Début et durée du projet scientifique :
mars 2024
- 36 Mois