Flash Info
CE45 - Mathématiques et sciences du numérique pour la biologie et la santé

Structures de graphe adaptées pour l'exploration de données de séquençage de troisième génération – Agate

Résumé de soumission

Les données de séquençage de troisième génération ont radicalement changé la bioinformatique des séquences. Grâce à leur longueur, la plupart des répétitions génomiques ne sont plus un problème et nous sommes aujourd'hui capables d'obtenir des fragments de génomes proches de l'échelle chromosomique. Toutefois, l'assemblage est toujours un sujet difficile, les séquences assemblées contiennent des erreurs et omissions de régions et de variations. De nombreuses applications basées sur les données de seconde génération sautent cette étape et utilisent un graphe de séquences, plus complet et intact.Ces approches fructueuses ont été rendues possible par l'existence de graphes pouvant être efficacement requêtés en utilisant des index capables de passer à l'échelle sur les plus grands jeux de données. Ce besoin renouvelé pour les données de troisième génération motive ce projet dont le but est de concevoir des structures de graphe capables de proposer des requêtes efficaces adaptées

Coordination du projet

Antoine Limasset (Centre de Recherche en Informatique, Signal et Automatique de Lille)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

CRIStAL Centre de Recherche en Informatique, Signal et Automatique de Lille

Aide de l'ANR 227 584 euros
Début et durée du projet scientifique : janvier 2022 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter