inhibition de la réplication du SARS-CoV2 par des genes non referencés et non codant dans les cellules humaines – DARK-COVID
restreindre la replication du sarscov2 par des genes non codants et non referencés
Notre hypothèse est que les cellules humaines expriment des gènes non codants et non référencés pouvant controler le SARS-CoV2. Nos objectifs sont d'identifier et de caractériser ces gènes dans les cellules humaines en combinant une approche originale comparant les variations du transcriptome total dans les cellules infectées vs celles non infectées voisines, avec des analyses de transcriptome sans référence, ainsi que des stratégies de criblage de perte de fonction et des études mécanistiques.
objectif: definir de nouveaux ARN impliqués dans la regulation du sarscov2
Le projet DARK-COVID articule 3 avancées majeures :<br />- La première analyse transcriptomique complète réalisée sur des cellules humaines triées positives ou non pour les antigènes du SArS-CoV2 pour avoir un aperçu de la réponse de l'hôte au SARS-CoV2 (WP1)<br />- La première description exhaustive d'ARNlnc mal régulés et d'ARN non référencés dans des cellules humaines infectées par le SRAS-CoV2, pour identifier des biomarqueurs spécifiques (WP2)<br />- La première caractérisation fonctionnelle de nouveaux gènes, qui modulent la réplication du SRAS-CoV2 dans les cellules humaines, pour révéler de nouvelles cibles thérapeutiques pour un futur traitement personnalisé (WP3)
Transcriptome
Bioinformatics
Genetic engineering
Transcriptomes (WP1)
Des cellules humaines ont été infectées par Sarscov2 puis triées selon leur statut d'infection. Les cellules exemptes de virus, les cellules infectées et les cellules non infectées ont été collectées en 6 réplicats chacune. L'ARN total et les ARN polyA+ ont été extraits. L'ARN du virus et l'ARN des ribosomes ont été enlevés et 500 ng d'ARN ont été séquencés sur une machine de séquençage HiSeq en utilisant un protocole illumine Trueseq. 20 millions de lectures uniques ont été cartographiés sur le génome humain (GencodeV32).
Analyse des jeux de données et annotation des lncRNA (WP2)
Les séquences alignées uniques ont été comptées avec HTseq et une analyse d'expression différentielle effectuée à l'aide de Deseq2 pour évaluer la dé-régulation de tous les gènes annotés. Globalement, l'ensemble du transcriptome a été affecté par la présence du virus. La comparaison entre l'ARN traité (POLYA+) et l'ARN total montre une dérégulation extrême de l'épissage et une lecture accrue en accord avec les précédentes observations publiées. Plusieurs ontologies génétiques ont été identifiées comme étant entièrement dé-régulées. Le gènes de l'interféron sont 10 fois plus exprimés dans les cellules infectées. Les cellules adjacentes non-infectées ne montrent aucun signe d'induction par le stress, comme si les cellules infectées étaient inactivées dans leur signalisation de réponse au stress.
Pour les nouveaux transcrits, scallop (v0.10.5) a été exécuté sur tous les réplicats d'ARN-seq totaux. Nos résultats montrent 5907 nouveaux transcrits détectés, avec 2523 significativement dans l'ARN total-seq et 745 dans l'enrichissement polyA-seq (>=10 lectures dans tous les réplicats dans au moins 1 condition).
Les lncRNA ou cov19lncRNA spécifiques du sarscov2 contiennent un site de démarrage de la transcription (pic CAGE de FANTOM dans les 1000 bases autour du TSS) et classés en 2 classes : 1-TSS faible : 176 (78 au total et 36 en PolyA+) et 2-fort TSS : 141 (74 Total et 42 polyA+). Ces 2 classes Up et Down (Figure 1) sont maintenant prêtes pour déterminer leur signification fonctionnelle.
WP1 est maintenant terminé
Validation et inactivation des candidats lncRNA (WP2)
Plusieurs lncRNA ont été sélectionnés pour valider leurs changements d'expression par RTqPCR en utilisant plusieurs clones et obtenir une évaluation statistiquement significative de leurs niveaux d'expression dans les différents ensembles de cellules infectées/non infectées/mock.
Les tentatives préliminaires pour inactiver un lncRNA d'intérêt indiquent que les oligos de SiRNA-pool sont l'approche la plus efficace pour obtenir une inactivation spécifique rapide des lncRNA cibles. Des expériences sont en cours pour déterminer si la réplication du virus est affectée lors de la perte de fonction de ces lncRNA.
WP 2 est terminé à 80 %.
Criblage de phénotypes (WP3)
A ce stade, aucun phénotype n'a encore été validé lors de perte de fonction.
WP3 est terminé à 0 %.
Les résultats les plus frappants que nous avons observés sont que les cellules voisines non infectées, à proximité des cellules infectées, ne présentent aucun signe de dérégulation des gènes, en particulier les gènes de l'interféron qui sont généralement régulés à la hausse lorsque les cellules détectent des infections virales. Ici, ils présentent un comportement « asymptomatique » comme pour les organismes infectés sans aucun signe d'infection. Comme cela a été montré dans des publications précédentes, les cellules infectées sont régulées à la baisse pour leurs voies d'exportation, ce qui réduit la signalisation du stress intercellulaire. Ici, c'est la première fois que nous rapportons en effet une absence de réponse des cellules adjacentes.
aucune
La pandémie de SARS-CoV2 a atteint des niveaux sans précédent tandis que les solutions de vaccination sont encore activement testées pour être délivrées en 2021. Malheureusement, les mécanismes de réponse cellulaire de l'hôte à l'infection et à la réplication du virus SRAS-CoV2 sont encore méconnus. Le premier niveau de réponse correspond au transcriptome de l'hôte, permettant une activation rapide des voies antivirales. Cependant, 2 limitations principales nuancent l'interprétation correcte des données. Premièrement, les études des interactions hôte-pathogène sont souvent obscurcies par la présence de populations mixtes de cellules infectées et non infectées. Certains signaux de transcriptome sont alors cachés par le bruit, ce qui rend impossible de décrire de manière efficace et exhaustive les variations complètes de la transcription de l'hôte. Deuxièmement, les études transcriptomiques et fonctionnelles les plus récentes du SRAS-CoV2 ont été menées sur le génome codant et l'ARN polyadénylé, en ignorant des régions entières (face cachée) du transcriptome hôte, qui est composé entre autres, de longs ARN non codants (lncRNA) ou non référencés (Unref)-ARN. Les LncRNA sont d’un intérêt particulier, car ils sont reconnus pour jouer des rôles fondamentaux dans l'identité cellulaire, le développement et la progression des maladies via des contrôles épigénétiques ou post-transcriptionnels de l'expression des ARNm. Notre hypothèse est que les cellules humaines expriment des signatures uniques de gènes non codants et non référencés qui présentent des activités inhibitrices encore non caractérisées contre le SRAS-CoV2. Nos objectifs sont d'identifier et de caractériser ces gènes en combinant des approches de transcriptome totales avec de l’ingénierie génétique sur des cellules humaines infectées. Notre stratégie originale compare les changements de la totalité du transcriptome dans les cellules infectées par le virus et les cellules voisines non infectées, en appliquant un tri cellulaire. En utilisant des stratégies d’analyses transcriptomiques comparatives et sans génome de référence, nous identifierons des ARN non référencés et des lncRNA dont les expressions sont régulées lors de l’infection par le SRAS-CoV2. Les approches génétiques par perte de fonction identifieront les lncRNA et les ARN non référencés qui jouent un rôle dans la réplication du virus. Enfin, une première analyse moléculaire fournira des informations préliminaires sur leurs mécanismes d'action. Le projet DARK-COVID s'articule au travers de l’axe 2 « Physiopathogénie de la maladie » de l'appel RA-COVID-19, en répondant à 3 aspects critiques : développement de modèles cellulaires (tri de cellules pulmonaires humaines surexprimant le récepteur viral ACE2), caractérisation de la réponse rapide immunitaire innée et indentification de nouvelles cibles thérapeutiques. DARK-COVID est un projet multidisciplinaire impliquant la virologie humaine, des études transcriptomiques de pointe et des outils bioinformatiques originaux. Il s'agit d'un projet pionnier dans le domaine des gènes antiviraux non codants et non référencés. Le consortium est composé de l’équipe de N. Jouvenet à l’Institut Pasteur, leader sur les flavivirus, expert en interactions hôte/virus et en manipulation SARSCoV2, et A. Morillon de l’Institut Curie, leader de l’annotation des lncRNA et de leurs études fonctionnelles dans la progression des maladies. Les 2 équipes collaborent intensivement depuis le début de la pandémie et ont déjà recueilli des résultats préliminaires prometteurs qui doivent être développés maintenant.
Coordination du projet
Antonin MORILLON (Institut Curie)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
IC Institut Curie
IP Institut Pasteur
Aide de l'ANR 136 998 euros
Début et durée du projet scientifique :
janvier 2021
- 12 Mois