Exploitation de la pléiotropie dans l'architecture génétique humaine en créant une carte de la pléiotropie à l'aide du machine learning – PleioMap
Bien que la pléiotropie, qui se produit lorsqu'un élément génétique a un effet causal sur au moins deux traits, est suspectée de jouer un rôle central dans l’architecture génétique des caractères et maladies complexes, c’est un phénomène mal compris. Ici, nous réexaminons des concepts connus de génétique humaine à travers le prisme de la pléiotropie et nous formulons l’hypothèse des 5 pléiotropies. En effet, la pléiotropie observée qui survient lorsqu'un variant génétique affecte plus d'un trait peut provenir de 5 mécanismes biologiques : 1) pléiotropie LD (déséquilibre de liaison) 2) pléiotropie verticale (causalité) 3) pléiotropie en réseau (corrélation génétique) 4) pléiotropie fortuite (polygénicité) 5) pléiotropie horizontale (effets indépendants).
Notre objectif global est d'étudier la pléiotropie et de modéliser les 5 types de pléiotropie à l'aide de mesures résumées publiques issues d'études d'association pangénomique (GWAS). Plus précisément, dans le Workpackage 1, nous allons construire une méthodologie exhaustive pour démêler les 5 états de pléiotropie en modélisant la pléiotropie due aux relations entre les traits tout en quantifiant la pléiotropie au niveau des variants génétiques, fournissant in fine une carte génomique de pléiotropie. Les stratégies pour atteindre ce premier objectif comprennent i) l'amélioration de notre méthode preuve de concept (proof-of-concept); ii) la réorientation des méthodes existantes utilisées pour modéliser les relations entre les traits complexes et les maladies; iii) la construction d’une nouvelle méthodologie statistique basée sur des algorithmes d'apprentissage automatique, notamment l'apprentissage semi-supervisé en utilisant des données eQTL (expression Quantitative Trait Loci) supplémentaires et une méthode de colocalisation pour étiqueter les variants génétiques pour la pléiotropie.
Dans le Workpackage 2.1, nous proposons d'étudier les relations entre les traits et maladies complexes issues de la pléiotropie. Une attention particulière sera accordée à la distinction entre les pléiotropies verticales et en réseau, qui découlent des relations causales entre les traits, des autres formes de pléiotropie. De plus, après avoir appliqué PleioMap à de nombreux traits, nous avons l'intention de développer des outils de visualisation pour construire des réseaux de relations entre traits et maladies complexes.
Dans le Workpackage 2.2, nous étudierons les effets pléiotropiques des variants génétiques eux-mêmes et ferons un inventaire des 5 types de pléiotropie validant ou invalidant notre modèle des 5 pléiotropies. En identifiant les effets pléiotropiques des variants génétiques qui, selon nous, peuvent être beaucoup plus faibles que les effets identifiés par les GWAS traditionnelles, nous espérons être en mesure de fournir des estimations d'héritabilité mises à jour pour les traits et maladies complexes et contribuer à améliorer la cartographie génétique (fine-mapping).
Le code complet pour produire PleioMap, la PleioMap elle-même ainsi que le réseau de relations entre les traits et maladies complexes seront en libre accès comme ressource pour la communauté scientifique.
Le projet PleioMap est ambitieux et stimulant, mais nous sommes convaincus que ce domaine de recherche présente un intérêt pour la communauté de génétique humaine et prospérera dans les années à venir. Nous nous attendons à ce que PleioMap ouvre de nouvelles voies pour des applications supplémentaires telles que la prédiction des effets secondaires de médicaments ou des effets hors cible de l'édition génomique (genome editing) et fournira des informations sur les nouveaux mécanismes biologiques derrière l'étiologie partagée des traits et des maladies. Par conséquent, nous espérons que PleioMap et l'étude de la pléiotropie auront des répercussions permettant le développement de nouvelles stratégies préventives et thérapeutiques et vers des applications de médecine personnalisée.
Coordination du projet
Marie VERBANCK (BIOSTATISTIQUE, TRAITEMENT ET MODELISATION DES DONNEES BIOLOGIQUES)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
					
						
							UP-BioSTM-EA7537 BIOSTATISTIQUE, TRAITEMENT ET MODELISATION DES DONNEES BIOLOGIQUES
						
					
				
				
					Aide de l'ANR 289 544 euros
				
				Début et durée du projet scientifique :
					janvier 2022
						- 42 Mois