T-ERC_STG - Tremplin-ERC Starting Grant 2025 2025

Maximiser la puissance des études génomiques avec les variants structuraux – SV4GenDis

Résumé de soumission

Les variants structuraux (VS) sont des variations génomiques de 50 nucléotides ou plus. Ils peuvent prendre plusieurs formes, allant de simples délétions et insertions à des réarrangements complexes. Malgré leur lien connu avec des troubles génétiques rares et certaines maladies courantes, ils restent absents de la plupart des grandes études génomiques sur les maladies, principalement en raison des difficultés techniques liées à leur identification. Cela veut dire que nous n’avons étudié jusqu’à maintenant que la moitié du génome variable, ce qui pourrait expliquer pourquoi une grande partie des facteurs génétiques des maladies est encore inconnue.
Ce projet transformateur comble cette lacune critique en concevant de nouvelles méthodes pour intégrer les VS dans les études d’association génomiques.
Nous exploiterons d’abord la puissance des données de séquençage à lecture courte et des outils pangénomiques de pointe pour génotyper les VS et mener une étude d’association sur les données de la UK Biobank. La UK Biobank a rassemblé une cohorte prospective d’un demi-million de personnes au Royaume-Uni, séquencé leur génome et partage ces données et des informations cliniques avec la communauté scientifique. Nous analyserons tout d’abord les VS dans 11 000 cas de maladies inflammatoires chroniques de l’intestin et autant de contrôles afin de faciliter l’interprétation des nombreux loci non caractérisés associés à la maladie et d’identifier de nouvelles associations. En effet, ce projet marquera la première analyse complète des VS au sein d’une aussi grande cohorte sur les maladies inflammatoires chroniques de l’intestin.
Nous développerons ensuite de nouvelles stratégies d’imputation des VS pour prédire les génotypes des VS à partir de petites variantes voisines. L’imputation utilise un catalogue d’haplotypes connus pour prédire le génotype des variants à partir d’expérience à faible résolution tels que les puces d’ADN ou les données de séquençage à faible couverture. Les variants structuraux ne sont actuellement pas bien imputés car nous manquons de catalogues d’haplotypes de grande qualité et de méthodes spécialisées pour modéliser leur complexité. Cependant, l’imputation des VS présente un énorme potentiel puisqu'elle permettrait de les intégrer dans les nombreuses études existantes qui ont utilisé ces tests moins coûteux. Ici, nous allons exploiter le catalogue complet d’haplotypes que nous sommes en train de constituer au sein du Human Pangenome Reference Consortium et les haplotypes de plus de vingt mille individus obtenus dans le Work Package 1. Ce catalogue unique d’haplotypes sera combiné à de nouvelles méthodes innovantes qui modélisent les VS. En plus d’imputer les VS à partir de polymorphisme d’un seul nucléotide, nous étendrons notre approche au séquençage à faible couverture afin de permettre une analyse rentable de grandes cohortes.
Après une évaluation technique approfondie, nous imputerons un large catalogue de VS dans l’ensemble des 500 000 individus de la UK Biobank. Ces VS, observés pour la première fois dans une aussi grande cohorte, seront testés contre douze traits communs, sélectionnés en raison de leur pertinence médicale et de leur héritabilité manquante connue. L’objectif est de maximiser la valeur ajoutée de l’intégration des VS en se concentrant sur les phénotypes ayant une forte composante génétique et une importance clinique. Ces traits comprennent, par exemple, l’hypertension, l’asthme, le diabète de type 2, et les maladies cardiaques. Ainsi, nous démontrerons la puissance de notre nouvelle approche à travers douze études d’association pangénomiques à grande échelle portant sur divers traits et maladies. En plus de ces applications, nous partagerons nos variants imputés avec les autres chercheurs travaillant sur UK Biobank, afin que tous les traits et toutes les maladies puissent bénéficier d’une image génomique plus complète des variants communs, incluant désormais la plupart des VS.

Coordination du projet

Jean MONLONG (Institut de Recherche en Santé Digestive)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

IRSD Institut de Recherche en Santé Digestive

Aide de l'ANR 114 881 euros
Début et durée du projet scientifique : décembre 2025 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter