JCJC - Programme "Jeunes chercheuses et jeunes chercheurs" 2006

INFERENCE DE SEQUENCES D'ADN A PARTIR DE DONNEES DE MICROMANIPULATION – UNZIPINFOSEQ

Résumé de soumission

Notre projet vise à définir un protocole expérimental et théorique pour effectuer le dégraffage mécanique d'une molécule unique d'ADN et en extraire l'information sur le contenu en bases de la séquence. Cette méthode pourra ensuite être appliquée à la prédiction de séquences inconnues ou l'analyse de la variabilité génétique du génome, c'est-à-dire la localisation dans un ADN individuel des différences (mutations, SNIPs ou encore déplacements de motifs entiers de séquence) par rapport aux séquences moyennes disponibles dans les banques de données. Ce séquençage mécanique pose des problèmes fondamentaux. Sur le plan théorique, nous avons une bonne compréhension du problème du dégraffage : étant donné une séquence, quel est le signal de force mesuré ? Il s'agit ici d'étudier le problème inverse : étant donné un signal de force, quelle est la séquence la plus probable ? Répondre à cette question fait appel de manière novatrice à des méthodes théoriques empruntées à la biophysique (modélisation du dispositif expérimental), la physique statistique (théorie des marches aléatoires biaisées, des systèmes désordonnés), à l'inférence statistique bayesienne, aux codes correcteurs d'erreur (algorithmes de Viterbi et de Belief Propagation). L'obstacle principal est de parvenir à extraire l'information malgré le bruit intrinsèque au signal, notamment le caractère stochastique de l'ouverture et fermeture des paires de bases et les variations d'extension des brins dégraffés dûs à l'agitation thermique. Du point de vue expérimental, il s'agit de construire un dispositif aussi peu bruité que possible. Nous réaliserons une double pince optique pour réduire la dérive de l'appareil. Ensuite, nous étudierons les variations d'extension des brins dégraffés en combinant mesure de force et techniques de fluorescence. Un système accepteur/donner FRET permettra de quantifier le bruit des brins dégraffés de manière précise ; ces mesures serviront à la modélisation théorique. Du point de vue théorique, l'enjeu est double. D'une part nous voulons comprendre comment l'information sur la séquence dépend du protocole de mesure (vitesse d'ouverture, durée totale de l'expérience, nombre de dégraffages de la même molécule, ...) afin d'optimiser ce protocole. D'autre part nous voulons développer et implémenter des algorithmes d'inférence qui permette d'extraire cette information et de faire des prédiction sur la séquence, base par base.

Coordination du projet

Organisme de recherche

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE ILE-DE-FRANCE SECTEUR PARIS A

Aide de l'ANR 150 000 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter