Projet maDMP4LS - Mettre le plan de gestion des données automatisé dans les mains des biologistes

3 questions sur ce projet lauréat de l’appel Flash science ouverte

 

 

En quoi l’application des principes de la science ouverte, à propos des données de la recherche, constitue un enjeu dans votre domaine, discipline ou spécialité ? 

Suite au développement de nouvelles technologies de séquençage des génomes et d’imagerie à haute résolution, les données bioinformatiques sont devenues massives, complexes et hétérogènes. Concurremment, leur traitement a suscité un foisonnement d’outils logiciels en évolution très rapide. La mise en œuvre des principes d’une science ouverte nécessite des pratiques de gestion des données pour les rendre FAIR (trouvables, accessibles, interopérables, réutilisables). Le plan de gestion de données (PGD) qui décrit, dès la conception d’un projet de recherche, les données qui seront produites, leur traitement, leur accessibilité, et leur devenir à long terme est un levier essentiel pour la “FAIRification”. 

Quels sont les objectifs du projet et les approches envisagées pour y répondre ?

Concrètement, pour maDMP4LS, nous envisageons de déployer et d’intégrer le PGD dans le processus scientifique par le biais d’une intégration logicielle de DMP OPIDoR, outil de conception de PGD, avec l’infrastructure de stockage et de calcul de l’IFB et avec la plateforme CeSGO qui fédère des outils de collaboration, gestion de projet, stockage et extraction de données. Il en résultera une plateforme d’outils informatiques interconnectés avec un PGD rendu ainsi "machine-actionable" (maDMP) : le PGD alimente les outils de traitement et gestion des données, et est à son tour actualisé par ces mêmes outils. Il est ainsi synchronisé avec le projet tout au long de son cycle de vie. Concrètement, pour maDMP4LS, nous envisageons de déployer et d’intégrer le PGD dans le processus scientifique par le biais d’une intégration logicielle de DMP OPIDoR, outil de conception de PGD, avec l’infrastructure de stockage et de calcul de l’IFB et avec la plateforme CeSGO qui fédère des outils de collaboration, gestion de projet, stockage et extraction de données. Il en résultera une plateforme d’outils informatiques interconnectés avec un PGD rendu ainsi "machine-actionable" (maDMP) : le PGD alimente les outils de traitement et gestion des données, et est à son tour actualisé par ces mêmes outils. Il est ainsi synchronisé avec le projet tout au long de son cycle de vie.

Quelles sont les perspectives en termes d’applications potentielles pour la communauté scientifique du domaine, des autres champs disciplinaires, ou encore pour la société ?

L’un des bénéfices attendus de cette démarche est la promotion du PGD en tant qu’outil d’aide à la production et à la valorisation des résultats scientifiques plutôt qu’un fardeau administratif. En outre, la transmission de bonnes pratiques communautaires à travers le DMP permettra de définir un environnement propice à la « FAIRification » des données. A plus long terme, il est envisagé d’interfacer DMP OPIDoR avec d’autres éléments logiciels et services intervenant dans le cycle de vie des données et de transposer ce concept d’intégration à d’autres domaines de la recherche. Ainsi, tous les éléments du PGD seront mis en œuvre et FAIR deviendra ainsi une réalité pour une science ouverte et accessible. Le projet maDMP4LS est coordonnée par Jacques Van Helden de l’Institut Français de Bioinformatique (IFB) qui est une infrastructure nationale qui mutualise, soutient et coordonne le développement des ressources pour les plateformes bioinformatiques.