Séquençage multi-échelle d'ADN génomique répété G/C riche par manipulation en molecule unique en pinces magnétiques – Museq
La plupart des techniques de séquençage d’ADN contiennent une étape d’amplification via une polymerase. Cette étape a plusieurs conséquences. La première est que l’information épigénétique portée par des bases modifiées dans l’échantillon de départ est perdue. Il existe des méthodes pour contourner ce problème, mais elles sont indirectes et couteuses. Deuxièmement, certaines régions, comme celles répétées et riches en guanines, sont difficiles à séquencer, la raison étant que les guanines ont tendance à s’empiler et à former des structures secondaires inhibant la réplication. Enfin, les fragments lus par les techniques modernes de séquençage sont de courte taille, ce qui est mal adapté à la résolution de séquences répétées en raison des problèmes qu’ils posent lors de l’assemblage sur un génome de référence. Ces séquences sont donc souvent éliminées des étapes d’analyse des projets de séquençage, malgré leur importance potentielle pour comprendre la structure des génomes.
Une des seules techniques de séquençage ne nécessitant pas d’ADN polymérase est la technique de séquençage par hybridation d’oligonucléotides sous pinces magnétiques, développée par l’équipe de Vincent Croquette à l’ENS. Cette méthode a plusieurs avantages pour contourner plusieurs limitations des techniques de séquençage existantes. Le but de ce projet est de développer une méthode peu coûteuse et fiable permettant de séquencer les régions G/C riches du génome, à la fois au niveau de la séquence, mais également au niveau épigénétique.
Le consortium impliqué dans ce projet est constitué de deux laboratoires académiques (l’ENS et le Museum) et un partenaire industriel (PicoSeq), une start-up émergent du laboratoire de l’ENS et qui développe les applications de cette technologie de séquençage pour le marché.
Le consortium a déjà obtenu des résultats justifiant les objectifs de ce projet. Au cours des dernières années, le Museum et l’ENS ont réalisé le séquençage de longues molécules répétées riches en G/C difficiles à séquencer par d’autres technologies. De plus, l’ENS et PicoSeq ont montré qu’en remplaçant les oligonucléotides par des anticorps, ils étaient capables de « séquencer » directement la position de ces marques épigénétiques en molécule unique d’ADN.
Le challenge actuel pour cette technologie est de développer une méthode efficace et peu coûteuse pour séquencer un locus spécifique capturé à partir d’un ADN génomique natif, sans étape d’amplification in vitro. Dans ce but, les trois partenaires proposent de travailler aux tâches suivantes :
-développement de méthodes de biologie moléculaire pour capturer sélectivement un locus G/C riche spécifique à partir d’ADN génomique natif, en en faisant un substrat manipulable par pince magnétique.
-continuer le développement de la technique de séquençage afin de permettre l’analyse de séquences répétées G/C riches, en améliorant à la fois le design des oligonucléotides (taille, composition chimique) et les logiciels nécessaires à l’analyse de séquence. Le but est d’étendre cette technologie afin de réaliser un véritable séquençage de novo, capable de résoudre les séquences difficiles formant des structures d’ADN particulières, comme par exemple les G-quadruplexes.
-développer des méthodes et des réactifs pour le séquençage de modifications épigénétiques, avec une attention particulière pour les marques d’oxydation portées par les guanines. En effet, ces marques d’oxydation sont reconnues comme d’importants biomarqueurs lors du vieillissement ou du cancer, mais leur détection reste indirecte et coûteuse via les méthodes de caractérisation existantes.
Ce projet fournira à la communauté un outil pour le séquençage génétique et épigénétique de toute région du génome, y compris contenant des répétitions complexes. Cela trouvera écho pour des applications biomédicales, ou des études fondamentales de la dynamique de l’ADN génomique.
Coordination du projet
Jean-Baptiste Boulé (Museum national d'Histoire naturelle - UMR 7196 Structure et instabilité des Génomes)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
MNHN Museum national d'Histoire naturelle - UMR 7196 Structure et instabilité des Génomes
ENS Laboratoire de Physique Statistique - UMR8550
PS PicoSeq SAS
Aide de l'ANR 358 879 euros
Début et durée du projet scientifique :
septembre 2015
- 36 Mois