Projet VizFaDa - Visualisation des données du consortium FAANG

3 questions sur ce projet lauréat de l’appel Flash science ouverte

En quoi l’application des principes de la science ouverte, à propos des données de la recherche, constitue un enjeu dans votre domaine, discipline ou spécialité ?

L’annotation de l’ADN des espèces animales d’élevage nécessite la production d’un grand nombre de données expérimentales. De ce fait, le travail d’un seul laboratoire n’y suffirait pas. Le consortium FAANG (functionnal annotation of animal genomes) permet de réunir les forces de travail en présence afin d’assurer une collecte des données produites dans différents laboratoires internationaux. Il assure leur hébergement, leur libre accès, et facilite leur réutilisation future via une uniformisation des méta-données.

Quels sont les objectifs du projet et les approches envisagées pour y répondre ?

Pour l’instant, le portail de données FAANG (https://data.faang.org) est austère, ne listant que les données brutes accessibles, tout en permettant une recherche via différents critères de méta-donnée. Les données brutes étant lourdes, obtenir la moindre information préliminaire nécessite des temps de téléchargement et de calcul non négligeables. L’objectif est d’enrichir le portail avec des visualisations riches et interactives, pour permettre une meilleure compréhension des données disponibles et favoriser leur ré-utilisation. Deux types de visualisations seront produites : 1) des matrices de similarités interactives permettant d’estimer le dégrée de ressemblance des différentes données, et 2) des visualisations associant niveau d’expression des gènes et propriétés de la chromatine.

Quelles sont les perspectives en termes d’applications potentielles pour la communauté scientifique du domaine, des autres champs disciplinaires, ou encore pour la société ?

L’impact immédiat de ce projet sera une amélioration du portail de donnée FAANG. Nous espérons que cela permettra une hausse de la réutilisation des données disponibles, et que cela incitera les chercheurs à partager leurs données via le consortium FAANG (ce qui nécessite de formater les métadonnées selon les standards décidés par le consortium). Une meilleure annotation des génomes (ce qui est l’objectif de FAANG) permettra de mieux sélectionner les animaux pour l’élevage de demain, avec des animaux robustes, efficaces, et conservant une vaste diversité génétique.

Nous espérons aussi que les principes de partage et valorisation des données via FAANG puissent être source d’inspiration pour d’autre consortium, notamment en ce qui concerne les plantes et les organismes modèles. Les outils créés par VizFaDa seront donc tous libre et open source.

Le projet Vizfada est coordonné par Guillaume Devailly (INRA). Il regroupe 2 partenaires : GenPhySE et Sigenae (INRA), et est financé pour une durée de 24 mois.