JCJC SVSE 6 - JCJC : Sciences de la vie, de la santé et des écosystèmes : Génomique, génomique fonctionnelle, bioinformatique, biologie systémique

Contrôle épigénétique et post-traductionnel de l'expression génique au sein de la chromatine – CHROMAPKA

Décryptage des rouages protéiques régulant l’expression de gènes

Notre objectif est d’identifier des protéines clés impliquées dans la modulation de l’expression de gènes. Notre contexte d’étude est la plante modèle Arabidopsis thaliana soumise à une attaque par un pathogène.

Vers une meilleure compréhension de la régulation de l’expression génique

Notre objectif est de déchiffrer, dans les échelles de temps et d’espace, les mécanismes moléculaires assurant la régulation de l’expression génique au sein de la chromatine. Par des approches de protéomique et de phosphoprotéomique, nous souhaitons reconstituer quelles protéines se déplacent de ou vers la chromatine et lesquelles sont modifiées de façon dynamique, notamment par des phosphorylations, pour orchestrer la re-programmation de l’expression génique suite à un stimulus donné. Afin d’appréhender ces questions, nous avons choisi un système modèle pour lequel une voie de signalisation a été largement caractérisée, par l’identification des protéines recrutées dans cette cascade depuis la membrane plasmique et dans tout le cytoplasme. Nous avons sélectionné la plante Arabidopsis thaliana, étudiée dans la situation particulière d’une attaque par un pathogène. Lorsque Arabidopsis est soumise à un stress occasionné par des pathogènes, son système immunitaire inné détecte des séquences moléculaires caractéristiques des pathogènes (PAMPs), molécules dérivées de structures abondantes de ces organismes (par exemple des constituants de la paroi cellulaire, comme la flagelline). Des voies de signalisation intracellulaires spécifiques sont alors déclenchées pour promouvoir la modulation de l’expression de certains ensembles de gènes et pour finalement développer des réponses adaptées. Cependant, seule une vision très parcellaire de la machinerie protéique orchestrant la régulation de l’expression génique en réponse à la flagelline a été obtenue jusqu’à présent et aucune information sur la dynamique temporelle de son recrutement n’a été acquise ; nous proposons dans ce projet de contribuer à une reconstitution plus complète de ce puzzle protéique complexe et dynamique.

Nous analysons des échantillons protéiques issus de fractions subcellulaires de plantes entières A. thaliana, afin d’en déterminer la séquence et les modifications covalentes, essentiellement les phosphorylations pouvant être présentes sur les résidus sérine, thréonine et tyrosine. Afin d’identifier les protéines et leurs modifications potentiellement variables suite à la stimulation appliquée aux plantes, nous mettons en œuvre des analyses de protéomique, qui reposent sur la caractérisation, par le couplage entre chromatographie et spectrométrie de masse, des échantillons protéiques digérés en peptides par une enzyme spécifique. Actuellement, obtenir l’identité d’un peptide phosphorylé, c’est-à-dire déterminer de façon fiable sa séquence en acides aminés et les sites de modification, demeure un défi. Or il est crucial d’identifier correctement ces séquences, afin de pouvoir reconnecter une phosphorylation dynamique à une famille de kinases particulières, et de déchiffrer les cascades de phosphorylations déclenchées au sein de la cellule suite au stimulus extérieur. Dans ce but, nous avons développé un programme bioinformatique permettant de fournir une identification plus fiable des séquences peptidiques phosphorylées à partir des spectres de masse. L’originalité de ce programme, nommé FragMixer, est qu’il peut combiner l’information présente dans des paires de spectres de fragmentation acquises sur chaque peptide, dans le but d’accroître les chances d’identification précise et correcte des séquences phosphorylées.

Nous avons pu analyser des échantillons de protéines nucléaires prélevées sur des plantes soumises à une simulation d’attaque par un pathogène, pendant 0, 5, 15, 30 ou 45 min. L’estimation de leur abondance relative entre les échantillons a permis de vérifier que la grande majorité d’entre elles ne montraient pas de variations significatives. En revanche, quelques-unes arborent un profil temporel d’abondance qui pourrait correspondre à un mouvement de relocalisation de/vers le noyau, et idéalement, de/vers l’environnement de la chromatine. Nous devons effectuer des recoupements entre les résultats obtenus sur deux préparations biologiques totalement indépendantes. Ensuite, si certaines protéines montrent un profil temporel cohérent entre les deux cinétiques de stimulation, nous envisagerons des expériences de validation, telles que le marquage de ces protéines par l’étiquette GFP (Green Fluorescent Protein), qui permettrait de suivre leur (re)localisation dans les cellules.
Les phosphorylations dynamiques des protéines peuvent fortement moduler leur activité, leur stabilité, leur localisation subcellulaire, etc. Afin de mieux identifier les sites de phosphorylation sur les séquences protéiques, nous avons développé un outil bioinformatique mis à disposition de la communauté scientifique : FragMixer (http://proteomics.fr/FragMixer/). Ce programme permet de traiter des données de spectrométrie de masse classique, qui consistent en la caractérisation de chaque peptide par un mode de fragmentation donné. Mais il permet aussi de combiner les informations présentes dans deux spectres de masse obtenus par deux modes de fragmentation complémentaires, lesquels sont susceptibles de fournir une identification notablement plus fiable qu’un seul spectre.

Le projet requiert des analyses pointues en protéomique. En termes d’identification fiables de séquences phosphorylées, pour pouvoir faire le lien entre kinases et substrats repérés comme intéressants. Et en termes de détection de relocalisation subcellulaire de protéines : un plan d’expérience et un traitement des données protéomiques quantitatives bien réfléchis sont nécessaires pour extraire des informations statistiquement valides. Nous avons développé des approches pour répondre à ces questions, que nous souhaitons diffuser, afin que d’autres chercheurs puissent les mettre en œuvre dans des contextes d’étude différents. En termes de connaissances biologiques, nous espérons révéler ou préciser des mécanismes de régulation chez Arabidopsis en identifiant le rôle clé de certaines protéines (histone désacétylases, etc) dans la modulation de l’expression de gènes. Nous souhaitons donc apporter une petite pierre dans un domaine de recherche en pleine effervescence, comme en témoigne le projet ‘Encode’ sur l’homme.

Nous avons commencé le projet en mettant au point des méthodes d’analyse perfectionnées pour mieux caractériser des échantillons de phosphopeptides ; des optimisations ont été effectuées au niveau de l’acquisition des données de spectrométrie de masse et

L’objectif du présent projet est de déchiffrer, dans les échelles de temps et d’espace, les mécanismes moléculaires assurant la régulation de l’expression génique au sein de la chromatine. Par des approches de protéomique et de phosphoprotéomique, nous souhaitons reconstituer, comme dans un film d’animation moléculaire, quelles protéines se déplacent de ou vers la chromatine et lesquelles sont modifiées de façon dynamique par des groupes chimiques covalents pour orchestrer la re-programmation de l’expression génique suite à un stimulus donné. Afin d’appréhender ces questions, nous avons choisi un système modèle pour lequel une voie de signalisation a été largement caractérisée, par l’identification des protéines recrutées dans cette cascade depuis la membrane plasmique et dans tout le cytoplasme. Nous avons sélectionné la plante Arabidopsis thaliana, étudiée dans la situation particulière d’une attaque par un pathogène. Lorsque Arabidopsis est soumise à un stress occasionné par des pathogènes, son système immunitaire inné détecte des séquences moléculaires caractéristiques des pathogènes (PAMPs), molécules dérivées de structures abondantes de ces organismes (par exemple des constituants de la paroi cellulaire). Des voies de signalisation intracellulaires spécifiques sont alors déclenchées pour promouvoir la modulation de l’expression de certains ensembles de gènes et pour finalement développer des réponses adaptées. Plus précisément, une cascade basée sur trois niveaux de protéines kinases, connue sous le nom de voie des Mitogen-Activated Protein Kinases (MAPKs), est impliquée dans le développement d’une réponse adaptée à une agression par des pathogènes. Suite à la détection de PAMPs telles que le peptide flagelline par le récepteur membranaire PLS2, deux branchements de la cascade globale des MAPKs sont activés : ils impliquent le recrutement de MAPKinase kinase kinases (MAP3Kinases), lesquelles phosphorylent des MAP2Kinases, qui activent enfin les MAPKinases 3, 4 et 6 par phosphorylation. Finalement, les MAPKs activent des facteurs protéiques responsables d’une augmentation ou diminution de l’expression de gènes spécifiques, dans le but de neutraliser l’attaque par des pathogènes. Quelques cibles protéiques de MAPKs ont déjà été identifiées, telles que les facteurs de transcription VIP1 et WRKY33. Cependant, seule une vision très parcellaire de la machinerie protéique orchestrant la régulation de l’expression génique en réponse à la flagelline a été obtenue jusqu’à présent et aucune information sur la dynamique temporelle de son recrutement n’a été acquise ; nous proposons dans ce projet de contribuer à une reconstitution plus complète de ce puzzle protéique complexe et dynamique. Arabidopsis thaliana va donc être utilisée comme système modèle pour comprendre les liens entre transduction de signal, composition dynamique de la chromatine et régulation de l’expression des gènes.

Coordinateur du projet

Madame Delphine PFLIEGER (CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE ILE-DE-FRANCE SECTEUR EST) – delphine.pflieger@univ-evry.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LAMBE CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE ILE-DE-FRANCE SECTEUR EST

Aide de l'ANR 210 000 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles