DONNEES - Appel flash science ouverte : Pratiques de recherche et données ouvertes

Visualisation des données du consortium FAANG – VizFaDa

Résumé de soumission

Les systèmes de production alimentaire devront devenir plus efficaces et plus durables pour relever les défis posés par la croissance démographique et la crise climatique. Les stratégies de sélection des animaux d’élevage ont permis des gains génétiques remarquables, mais les efforts doivent se poursuivre. La fourniture d'annotations de qualité pour les génomes animaux est nécessaire pour continuer l’amélioration de la valeur génétique des animaux d’élevages. L'initiative FAANG (annotation fonctionnelle des génomes animaux) vise à rassembler une communauté pour promouvoir les principes de données FAIR dans ce domaine (ref 1–3). Un centre de coordination des données (DCC) de l'EMBL-EBI développe le portail de données FAANG pour permettre aux données FAANG d'être plus trouvables, accessibles, interopérables et favoriser leur réutilisation (principes FAIR) (ref 2).

Cette proposition, VizFaDa, vise à produire des visualisations interactives des données FAANG à travers des applications web, et travaillera avec l'EMBL-EBI pour intégrer ces visualisations dans le portail existant. Tout d'abord, nous allons calculer les corrélations entre paires d’échantillons FAANG (expression des gènes et données épigénétiques), et afficher les résultats sous forme de heatmaps clusterisées de corrélation, interactives et filtrables. Les utilisateurs pourront téléverser leurs données traitées pour les comparer aux échantillons FAANG en quelques secondes. Ces heatmaps de corrélation fourniront une vue d'ensemble des données disponibles et de leurs similitudes. Deuxièmement, nous intégrerons les données épigénétiques et transcriptomiques ensembles en produisant des profils épigénétiques empilés, près du débuts des gènes, de la fin des gènes et des exons intermédiaires, triés selon le niveau d'expression des gènes ou le taux d'inclusion des exons. Ces visualisations attrayantes exposeront les liens complexes existant entre les marques épigénétiques et la transcription, et ajouteront de la valeur au jeu de données FAANG.

Des efforts seront consacrés à rendre l'ajout de nouveaux échantillons de la base de données aussi automatique que possible, afin d'assurer la pertinence à long terme de nos outils. Le développement des applications web sera entièrement open source. Nous espérons que nos efforts renforceront l'attrait du portail de données FAANG pour les chercheurs et les sélectionneurs, et encourageront la réutilisation de ces données.

Coordination du projet

Guillaume Devailly (Génétique Physiologie et Systèmes d'Elevage)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

GenPhySE Génétique Physiologie et Systèmes d'Elevage

Aide de l'ANR 76 068 euros
Début et durée du projet scientifique : décembre 2019 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter