Suite au développement de nouvelles technologies de séquençage des génomes et d’imagerie à haute résolution, les données bioinformatiques sont devenues massives, complexes et hétérogènes. Concurremment, leur traitement a suscité un foisonnement d’outils logiciels en évolution très rapide. La mise en œuvre des principes d’une science ouverte nécessite des pratiques de gestion des données pour les rendre FAIR (trouvables, accessibles, interopérables, réutilisables). Le plan de gestion de données (PGD) qui décrit, dès la conception d’un projet de recherche, les données qui seront produites, leur traitement, leur accessibilité, et leur devenir à long terme est un levier essentiel pour la “FAIRification”.
Concrètement, pour maDMP4LS, nous envisageons de déployer et d’intégrer le PGD dans le processus scientifique par le biais d’une intégration logicielle de DMP OPIDoR, outil de conception de PGD, avec l’infrastructure de stockage et de calcul de l’IFB et avec la plateforme CeSGO qui fédère des outils de collaboration, gestion de projet, stockage et extraction de données. Il en résultera une plateforme d’outils informatiques interconnectés avec un PGD rendu ainsi "machine-actionable" (maDMP) : le PGD alimente les outils de traitement et gestion des données, et est à son tour actualisé par ces mêmes outils. Il est ainsi synchronisé avec le projet tout au long de son cycle de vie. Concrètement, pour maDMP4LS, nous envisageons de déployer et d’intégrer le PGD dans le processus scientifique par le biais d’une intégration logicielle de DMP OPIDoR, outil de conception de PGD, avec l’infrastructure de stockage et de calcul de l’IFB et avec la plateforme CeSGO qui fédère des outils de collaboration, gestion de projet, stockage et extraction de données. Il en résultera une plateforme d’outils informatiques interconnectés avec un PGD rendu ainsi "machine-actionable" (maDMP) : le PGD alimente les outils de traitement et gestion des données, et est à son tour actualisé par ces mêmes outils. Il est ainsi synchronisé avec le projet tout au long de son cycle de vie.
L’un des bénéfices attendus de cette démarche est la promotion du PGD en tant qu’outil d’aide à la production et à la valorisation des résultats scientifiques plutôt qu’un fardeau administratif. En outre, la transmission de bonnes pratiques communautaires à travers le DMP permettra de définir un environnement propice à la « FAIRification » des données. A plus long terme, il est envisagé d’interfacer DMP OPIDoR avec d’autres éléments logiciels et services intervenant dans le cycle de vie des données et de transposer ce concept d’intégration à d’autres domaines de la recherche. Ainsi, tous les éléments du PGD seront mis en œuvre et FAIR deviendra ainsi une réalité pour une science ouverte et accessible. Le projet maDMP4LS est coordonnée par Jacques Van Helden de l’Institut Français de Bioinformatique (IFB) qui est une infrastructure nationale qui mutualise, soutient et coordonne le développement des ressources pour les plateformes bioinformatiques.