Séquençage de longs polymères numériques dans des nanopores biologiques – 01Pores
Notre société moderne produit chaque jour plusieurs exaoctets de données ; ce qui génère de nombreux problèmes de stockage et d’archivage. A cette vitesse, les supports de stockage traditionnels tels que les disques durs et les bandes magnétiques seront probablement bientôt dépassés et, de ce fait, il est urgent d’explorer de nouvelles technologies permettant des stockages plus denses. Parmi les nouvelles pistes explorées, les polymères synthétiques à séquences contrôlées sont très prometteurs car ils allient une très haute densité de stockage à une grande stabilité à température ambiante. Cependant, les méthodes analytiques permettant le décodage de ces polymères sont pour le moment assez fastidieuses, ce qui limite leur utilisation à grande échelle. Pour résoudre ce problème, nous proposons d’étudier dans de projet des nanopores biologiques permettant de décoder de l’information binaire stockée dans des polymères à séquence contrôlées. Ce projet est une collaboration binationale impliquant des chercheurs français (CNRS, Strasbourg) spécialistes de la synthèse de polymères numériques et des experts suisses (École Polytechnique Fédérale de Lausanne, EPFL) sur le séquençage nanopore. Une preuve de faisabilité, impliquant la lecture d’oligo(phosphodiester)s codés dans des pores d’aérolysine modifiés, a été récemment publiée par ce consortium. Ce projet propose d’aller encore loin et d’identifier de nouvelles solutions pour décrypter de plus grandes quantité de données. Pour ce faire, la structure moléculaire des polymères et les outils de lecture seront optimisés afin de développer un système optimal de séquençage. Tout d’abord la structure moléculaire des monomères codés sera étudiée et optimisée par simulation de dynamique moléculaire. Cette étude préliminaire permettra de comprendre quels paramètres moléculaires (par exemple la taille d’une unité codée, la rigidité de la chaîne principale, l’encombrement stérique des groupements latéraux, les bouts de chaînes) influencent le plus les interactions entre les polymères en solution et la cavité du pore. Les monomères les plus prometteurs seront ensuite synthétisés et polymérisés. Tous les poly(phosphodiester)s numériques du projet seront préparés par chimie automatisée de phosphoramidite. Ce seront principalement des chaines linéaires contenant entre 10 et 100 monomères. Ces structures seront bio-hybrides car elles contiendront des monomères codés non-naturels mais aussi de courts segments d’oligonucléotides. Ces derniers permettront de guider le passage des macromolécules dans les pores mais aussi à construire des superstructures macromoléculaires plus grandes par auto-assemblage d’ADN. Tous ces polymères seront tout d’abord caractérisés par RMN, HPLC, électrophorèse et spectrométrie de masse. Ils seront ensuite analysés dans des pores d’aérolysine modifiés. En plus de l’aérolysine K238A utilisée dans la preuve de faisabilité récemment publiée, un grand nombre d’autres variants d’aérolysine sont disponibles à l’EPFL et seront étudiés dans ce projet de manière systématique. Dans tous les cas, les signaux générés par le pore seront analysés à l’aide de méthodes d’apprentissage profond. Le domaine des polymères synthétiques informationnels étant très récent, les résultats de ce projet devraient conduire à des solutions innovantes pour le stockage de données mais aussi pour d’autres applications telles que la traçabilité de matériaux et la lutte anti-contrefaçon.
Coordination du projet
jean-francois lutz (Institut de Science et d'Ingénierie Supramoléculaires (UMR 7006))
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
EPFL Ecole Polytechnique Fédérale de Lausanne
ISIS Institut de Science et d'Ingénierie Supramoléculaires (UMR 7006)
Aide de l'ANR 391 319 euros
Début et durée du projet scientifique :
décembre 2022
- 48 Mois