Structures de graphe adaptées pour l'exploration de données de séquençage de troisième génération – Agate
Les données de séquençage de troisième génération ont radicalement changé la bioinformatique des séquences. Grâce à leur longueur, la plupart des répétitions génomiques ne sont plus un problème et nous sommes aujourd'hui capables d'obtenir des fragments de génomes proches de l'échelle chromosomique. Toutefois, l'assemblage est toujours un sujet difficile, les séquences assemblées contiennent des erreurs et omissions de régions et de variations. De nombreuses applications basées sur les données de seconde génération sautent cette étape et utilisent un graphe de séquences, plus complet et intact.Ces approches fructueuses ont été rendues possible par l'existence de graphes pouvant être efficacement requêtés en utilisant des index capables de passer à l'échelle sur les plus grands jeux de données. Ce besoin renouvelé pour les données de troisième génération motive ce projet dont le but est de concevoir des structures de graphe capables de proposer des requêtes efficaces adaptées
Coordination du projet
Antoine Limasset (Centre de Recherche en Informatique, Signal et Automatique de Lille)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
					
						
							CRIStAL Centre de Recherche en Informatique, Signal et Automatique de Lille
						
					
				
				
					Aide de l'ANR 227 584 euros
				
				Début et durée du projet scientifique :
					janvier 2022
						- 48 Mois