Les ARN AluACA, une nouvelle classe d’ARN non codants à boîte H/ACA humains – AluACA
Les ARN AluACA, une nouvelle classe d’ARN non codant à boîte H/ACA humains
Notre équipe s’intéresse depuis de nombreuses années à la compréhension de la complexité fonctionnelle des petits ARN nucléolaires à boite C/D et H/ACA et des RNP spécifiques du corps de Cajal (snoRNP et scaRNP). En étudiant un groupe de RNP humaines à boite C/D et H/ACA associées à WDR79, nous avons découverts une nouvelle classe de RNP H/ACA humaines appelées les RNP AluACA. Les ARN AluACA sont produits à partir des séquences répétitives Alu introniques.
Nous espérions qu’étudier la biogénèse et la localisation nucléaire des RNP AluACA nous mènerait à de nouvelles informations importantes concernant la biologie des RNP humaines associées à WDR79
Les différentes RNP contenant la protéine WDR-79 jouent des rôles importants dans la cellule. En effet, certaines participent aux modifications de nucléotides en guidant des pseudouridylations (pour les scaRNP H/ACA) ou des méthylations en 2’-O-ribose (pour les scaRNP C/D) sur les snARN du spliceosome, tandis que la RNP télomérase catalyse la synthèse des télomères. <br />Nous avons récemment identifié une nouvelle classe de RNP contenant WDR-79 associé à une famille d’ARN non codants : les AluACA. Aujourd’hui encore, la fonction de ces RNP AluACA reste élusive. Ce projet visait à déterminer le mode de biosynthèse, le trafic intracellulaire et la fonction des RNP contenant WDR-79 en s’intéressant plus particulièrement aux RNP AluACA. Nous avons donc tenté de purifier les particules AluACA dans des cellules Hela sur-exprimant ces ARN. De plus, nous avons testé la capacité des RNP AluACA à contrôler l’activité de l’ARN polymérase II comme il avait été précédemment montré pour les ARN B2 de rongeurs. <br />Enfin, les scaARN H/ACA, les AluACA et l’ARN de la télomérase lient la protéine WDR-79 grâce à une séquence commune appelée la CAB box (consensus ugAG). De manière surprenante, cette CAB-box est absente chez les scaARN C/D suggérant que ces ARN lient la protéine WDR-79 de manière différente. Nous avons donc entrepris l’identification de la séquence minimale permettant l’association des scaARN C/D avec WDR-79.
Nous avons étudié la localisation intranucléaire des ARN AluACA associés à WDR79 et des ARN à boite C/D mutants et sauvages par hybridation in situ en fluorescence. Nous avons observé la production in vivo et l’accumulation d’ARN AluACA sauvages, mutants et chimériques par Northern Blot et protection à la RNAse A/T1 en utilisant des sondes antisens séquence spécifique. L’assemblage des RNP contenant des ARN AluACA et des scaARN à boite C/D sauvages et mutants a été étudié grâce à des techniques de co-immunoprécipitation.
Nous avons démontré que les RNP associées à WDR79 se répartissent en 4 groupes distincts : les scaRNP à boite H/ACA, les scaRNP à boite C/D, les AluACA RNP et les télomérase RNP. Nous avons montré que les ARN AluACA portant une tige boucle 5’ anormalement courte ou longue qui, selon les expériences préalable avec des ARNs H/ACA, n’ont pas la capacité à soutenir l’accumulation des ARN et l’assemblage des RNP. L’analyse systématique des ARN mutants a montré que la tige boucle 3’ des ARN AluACA humains et des ARN de la télomérase humaine (hTR) partage un élément commun appelé la BIO box, qui soutient la maturation 3’ des ARN et l’assemblage des RNP. La BIO box est un site probable de liaison spécifique de la protéine NHP2, protéine cœur des RNP H/ACA, qui se lie de façon non spécifique aux ARN H/ACA canoniques. Nous avons démontré que la suraccumulation de AluACA est toxique pour les cellules. Cette découverte, bien qu’excluant la possibilité de surexprimer les ARN AluACA pour les purifier, nous indique l’importance biologique des RNP AluACA. Les ARNs B2 murins qui ont la même origine que des ARN Alu, ont été reportés pour interagir avec l’ARNPII. Nous avons donc étudié l’interaction des ARN nucléaires humains avec l’ARNPII. Bien que nous ayons échoué à détecter les ARN AluACA, nous avons trouvé le snARN 7SK associé spécifiquement avec une fraction de ARNPII hyperphosphorylé en Ser5 et Ser7. Nous avons montré que la snRNP 7SK favorise l’expression de gène des ARN de l’épissage transcrit par RNAPII. Nous avons trouvé que la snRNP 7SK exerce cette fonction comme composant de LEC, un facteur de transcription des ARN de l’épissage. WDR79 s’assure que les scaRNP à boite H/ACA et C/D s’accumule dans les corpuscules de Cajal. Précédemment, nous avons démontré que WDR79 se lie à la boite CAB des scaARN H/ACA. Maintenant nous avons montré que les scaARN à boite C/D sont ciblés dans le corps de Cajal par des séquences répétitives à dominantes de GU à travers la liaison à WDR79.
Notre travail a déjà mené à de nouvelles découvertes dans la biologie des petites RNP nucléaires humaines. Nos découvertes les plus significatives sont :
- Démonstration que les ARN AluACA et l’ARN de la télomérase humaine partagent un élément structural de l’ARN commun (BIO box) nécessaire à l’assemblage de la RNP.
- Démonstration que la snRNP contenant 7SK fonctionne comme un véritable facteur de transcription.
- Analyse des éléments de ciblage des scaARN à boite C/D dans les corps de Cajal
La BIO box est supposée être un élément spécifique de l’ARN de la télomérase induisant la production des extrémités 3’ et l’accumulation du hTR.
Nos résultats préliminaires indiquent que la BIO box fonctionne comme un site de liaison pour NHP2 qui s’associe avec la tige boucle 3’ de hTR et des ARN AluACA avec une forte spécificité et efficacité. En collaboration avec les Dr Lebaron S et Leulliot N (Laboratoire de Cristallographie et RMN Biologiques, Université Paris Descartes,Paris) nous étudions actuellement l’association de NHP2 avec les ARN AluACA et hTR. Ainsi nos résultats vont aussi améliorer la compréhension de la biogenèse des RNP contenant la télomèrase. Nos découvertes qui démontrent que 7SK est une snRNP régulatrice multifonctionelle participant dans la régulation de la transcription de différentes façons ouvre la voie à de nouveaux domaines passionnants à étudier.
1. Marnef, A., Richard, P., Pinzón, N. and Kiss, T. (2014) Targeting of vertebrate intron-encoded box C/D 2’-O-methylation guide RNAs into the Cajal body. Nucleic Acids Res., 42, 6616-6629.
(http://nar.oxfordjournals.org/content/42/10/6616.long)
2. Marnef, A., Jády, B.E. and Kiss, T. (2015) Human polypyrimidine tract-binding protein interacts with mitochondrial tRNAThr in the cytosol. Nucleic Acids Res., (in press) pii: gkv1355
3. Egloff, S., Vitali, P., Raffel, R., Murphy, S. and Kiss, T. (2016) The 7SK snRNP associates with the little elongation complex to promote snRNA gene expression. Genes & Dev., (submitted)
Les projets de séquençage des génomes eucaryotes ont mené à une découverte surprenante : alors que la taille des génomes a augmenté très rapidement au cours de l’évolution, le nombre de gènes codant des protéines n’a subi qu’une croissance modérée. Cette découverte a abouti à la conclusion que le génome des eucaryotes supérieurs présente, en plus des gènes codant les protéines, une autre source d’information génétique. Les techniques de séquençage à haut-débit ont ensuite démontré que les génomes eucaryotes codent pour un nombre incroyable d’ARN ne codant pas pour des protéines (également appelés ARN non-codants ou ARNnc). La plupart de ces ARNnc fonctionne en tant qu’ARN régulateurs dans tous les aspects de l’expression génique, contribuant ainsi à la complexité du génome des organismes eucaryotes. Les cellules eucaryotes expriment un très grand nombre d’ARN non codant (ARNnc) qui fonctionnent en tant qu’ARN régulateurs dans tous les aspects de l’expression génique, contribuant ainsi à la complexité du génome des organismes eucaryotes. Les ARN à boîte H/ACA représentent un groupe d’ARNnc abondants, conservés au cours de l’évolution et ayant des fonctions cellulaires diverses. Les ARN H/ACA sont notamment responsables de la pseudouridylation de diverses classes d’ARN cellulaires, du clivage nucléolytique des précurseurs des ARNr, de la synthèse de l’ADN télomérique, et certains d’entre eux servent également de précurseurs de microARN. Tous les ARN H/ACA s’associent avec quatre protéines cœur, la dyskérine, Nhp2, Nop10 et Gar1, et ils s’accumulent soit dans le nucléole, soit dans les corps de Cajal. Les ARN H/ACA spécifiques des corps de Cajal s’associent également avec la protéine Wdr79. Dans notre laboratoire, la caractérisation récente des ARN humains associés à Wdr79 a permis l’identification de plus de 400 nouveaux ARN H/ACA putatifs. En plus de certains ARN H/ACA canoniques, nous avons identifié 348 nouveaux ARN H/ACA humains codés par des éléments répétitifs Alu localisés dans les introns de gènes codant des protéines. Nous avons démontré que ces ARN H/ACA dérivant de séquences Alu, appelés ARN AluACA, sont synthétisés et maturés à partir des séquences Alu introniques de façon dépendante des boîtes H et ACA. Les RNP AluACA matures s’associent avec les quatre protéines cœur et Wdr79 mais, de façon inattendue, co-localisent avec les petits ARN nucléaires de la machinerie d’épissage dans le nucléoplasme. Les éléments Alu sont les éléments répétés les plus abondants dans le génome humain, mais leurs fonctions restent majoritairement inconnues. Dérivants du gène codant l’ARN 7SL, les éléments Alu ont été propagés par retro-transposition dans les génomes des primates. Les ARN AluACA nouvellement découverts représentent donc une nouvelle sous-classe abondante d’ARN H/ACA humains- ou primates-spécifiques. Je propose un programme de recherche visant à disséquer la biogénèse, le traffic et la fonction cellulaire de ce fascinant groupe de RNP humaines.
Coordination du projet
Tamas Kiss (Organisme de recherche)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
Aide de l'ANR 194 930 euros
Début et durée du projet scientifique :
June 2013
- 42 Mois