Fouille des données génomiques de Plasmodium falciparum pour prédire la fonction des gènes orphelins et identifier de nouvelles cibles thérapeutiques – PlasmoExplore
Contexte et motivation Contexte et motivation La malaria (ou paludisme) touche selon le dernier rapport de l'OMS-Unicef de l'ordre de 500 millions d'êtres humains dans le monde, et tue environ 3 millions de personnes par an, essentiellement des enfants, et surtout en Afrique. Cette maladie infectieuse est causée par un organisme unicellulaire, Plasmodium falciparum, transmis par des moustiques du genre Anopheles. La lutte contre cet agent infectieux se heurte à de nombreux problèmes, dont les trois majeurs sont : l'apparition de résistances aux quelques traitements existant aujourd'hui (chloroquine et dérivés, sulfadoxine pyriméthamine, méfloquine et artémisinine) ; le faible nombre de nouvelles cibles thérapeutiques, lié au fait que le génome de P. falciparum est très mal connu, l'échec de toutes les tentatives de vaccin. Le projet PlasmoExplore a pour objectif de contribuer au décryptage du génome de P. falciparum, et de répondre par là au point (2) ci-dessus en mettant à jour la fonction de gènes orphelins (inconnus), qui constitueront autant de nouvelles cibles thérapeutiques potentielles. Cette tâche, difficile en général, est particulièrement ardue dans le cas de P. falciparum. Il s'agit d'un organisme complexe, comportant une face végétale résultant d'une endosymbiose ancienne avec une algue rouge. Son cycle parasitaire est également complexe, puisqu'il séjourne successivement dans les cellules de l'endothélium digestif de l'Anophèle, le foie humain, puis les globules rouges (érythrocytes) humains, et subit de nombreuses transformations au sein de chacun de ces sites successifs. Son génome (publié en 2002) est tout à fait atypique car comportant une très forte proportion de A et T (80%), alors que la moyenne est aux alentours de 50%. Ses protéines elles mêmes sont atypiques, car leur composition en acides aminés est fortement biaisée par la richesse en AT, et parce qu'elles sont en moyenne 20% plus longues que les protéines homologues connues dans les autres organismes. Toutes ces difficultés accumulées font que des caractéristiques fonctionnelles (pour la plupart non encore vérifiées expérimentalement) n'ont pu être proposées que pour 40% des gènes de P. falciparum et ceci, grâce à l'identification de gènes homologues (dans des organismes voisins) dont la fonction était déjà connue. Il reste donc 60% de gènes orphelins, dont la fonction est totalement inconnue. Leur nombre est de ~3000, suivant la base PlasmoDB qui répertorie une grande partie des connaissances génomiques disponibles sur P. falciparum. L'objectif de PlasmoExplore est de prédire la fonction de ces 3000 gènes inconnus (orphelins). Nous nous appuierons sur : les données génomiques, de P. falciparum lui-même, mais aussi des espèces proches dont un grand nombre sont en cours de séquençage et devraient être disponibles prochainement ; les données post-génomiques, essentiellement le transcriptome issu des puces à ADN et indiquant le niveau d'expression des gènes dans diverses conditions ou à divers stades parasitaires, mais aussi l'interactome et le protéome. Ces données sont hétérogènes, elles sont de qualités fort différentes (par exemple, le transcriptome est très bruité, alors que les données de séquençage sont généralement fiables), et surtout elles apportent des informations très différentes. Egalement, ces données sont en évolution et augmentation constante, du fait des grands programmes internationaux sur la thématique. Retombées scientifiques et techniques attendues Retombées scientifiques et techniques attendues La méthode générale d'exploitation de ces données combinera : les ontologies du consortium Gene Ontology (GO), qui définissent la fonction des gènes suivant trois points de vue : la fonction cellulaire, la fonction biochimique, et la localisation ; les méthodes d'alignement (y compris le développement de matrices de score dédiés à P. falciparum et prenant en compte les biais de composition en nucléotides ou acides aminés) pour exploiter le
Coordination du projet
Organisme de recherche
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
MUSEUM NATIONAL D'HISTOIRE NATURELLE
COMMISSARIAT A L'ENERGIE ATOMIQUE ET AUX ENERGIES ALTERNATIVES - DIRECTION DU CENTRE DE FONTENAY-AUX-ROSES
Aide de l'ANR 447 271 euros
Début et durée du projet scientifique :
- 36 Mois