Implémenter les principes FAIR dans le système d'information Theia/OZCAR – FairTOIS
FairTOIS : Mise en œuvre des principes FAIR pour le système d'information Theia/OZCAR
Mise en œuvre des principes FAIR dans Theia/OZCAR, le système d'information national inter-organismes sur les données de recherche des surfaces continentales.
Un système d’information qui rassemble et expose de façon homogène et standardiée toutes les données d'observation in situ des surfaces continentales.
L'objectif du Système d'Information (SI) Theia/OZCAR est de rendre visible et facile d'accès toutes les données in situ de surface continentale, de faciliter leur découverte sur un portail unique, de permettre leur interopérabilité et de favoriser leur citation.<br /> <br />Le développement du SI Theia/OZCAR a démarré en 2017. Il est développé conjointement par l'Infrastructure de Recherche (IR) OZCAR (Réseau français des observatoires des zones critiques) et le pôle de données des surfaces continentales Theia. Theia/OZCAR fait partie de l'infrastructure française de recherche numérique Data Terra «Observation intégrée du système Terre«.
Theia/OZCAR est développé sur la base des standards internationaux d'échange de données (INSPIRE, OGC) et s'engage à mettre en œuvre les principes FAIR, notamment pour préparer la communauté française à l'intégration des projets européens.
Tous ces développements sont réalisés en collaboration avec l’IR Data Terra, et les pôles données des autres grands compartiments du système terre (océan, atmosphère, terre interne), pour garantir l'interopérabilité des systèmes et des données. Les développements sont également régulièrement présentés et coordonnés avec l'équipe européenne eLTER.
Le projet FairTOIS a consolidé et enrichi l'implémentation des principes FAIR sur 3 aspects : (1) la découverte de données via des noms de variables et d'objets d'intérêt standardisés, en utilisant le framework i-Adopt ; (2) l'interopérabilité des métadonnées, en mettant en place un webservice standardisé ; et (3) la diffusion et la formation aux principes de données FAIR dans la communauté des Surfaces Continentales et de la Zone Critique via les réunions OZCAR RI et les contributions à plusieurs écoles thématiques.
Le projet a ainsi permis d’améliorer la visibilité des observatoires : au départ du projet, 7 observatoires sur 22 étaient visibles sur le portail Theia/OZCAR. Ce chiffre est monté à 16/22 à la fin du projet FairTOIS, ce qui est un net progrès, mais reste encore insatisfaisant.
En coordination avec l'équipe européenne, un workflow utilisant les services d'interopérabilité a été mis en place en 2021. Il alimente automatiquement le nouveau portail européen eLTER avec tous les jeux de données présents dans OZCAR/Theia IS.
Le projet national inter-organismes Theia/OZCAR, ne s’arrête pas avec la fin du projet FairTOIS.
Les prochaines étapes identifiées sont à la fois de continuer le développement du portail et d’augmenter le nombre d’observatoires visibles, toujours en concertation avec nos partenaires nationaux et internationaux.
L’offre du portail va évoluer pour offrir notamment la visualisation et le téléchargement des données. Theia/OZCZAR permettra ainsi d’avoir un format de sortie identique pour les variables choisies, quelle que soit la provenance des données. Ce point a été identifié comme chronophage et même bloquant par les utilisateurs de données lors des réunions de concertation.
Le deuxième objectif est de mobiliser et aider les scientifiques des observatoires pour mettre à disposition leurs données. Nous allons ainsi mettre en place une API utilisant les services d’interopérabilité (CSW, SensorThings) pour les observatoires qui l’ont demandé. Nous avons également identifié le besoin et rédigé le profil d’un « data curator », afin d’accompagner les scientifiques dans la description de leurs données.
Articles scientifiques :
• Braud I., V. Chaffard, C. Coussot, S. Galle, P. Juen, and the Theia/OZCAR team (25 co-authors), 2020. « Building the Information System of the French Critical Zone Observatories Network: Theia/OZCAR-IS ». Hydrological Sciences Journal Special Issue: Hydrological data: opportunities and barriers. 02626667.2020.1764568 ; doi.org/10.1080/02626667.2020.1764568 ?hal-insu-02917629?
• Beretta, V., Desconnets, J.-C., Mougenot, I., Arslan, M., Barde, J., and Chaffard, V.: A user-centric metadata model to foster sharing and reuse of multidisciplinary datasets in environmental and life sciences, Computers & Geosciences, 154, 104807, doi.org/10.1016/j.cageo.2021.104807, 2021.
Autres productions :
• Site web Theia/OZCAR : www.theia-land.fr/product/donnees-in-situ/
• Plan de Gestion des Données (PGD) du système d’information Theia/OZCAR. Accessible en line sur OPIDOR (en): dmp.opidor.fr/public_plans , 20 p.
• Portail de données Theia/OZCAR : in-situ.theia-land.fr
• Thesaurus Theia/OZCAR : w3id.org/ozcar-theia ; DOI : 10.17178/67b5a1d5-8c8c-4a94-a646-1cca1d0adf79
• GitHub Theia/OZCAR : github.com/theia-ozcar-is/
• Guide pour les producteurs de données (thésaurus, modèle de données pivot Theia/OZCAR, procédure de dépôt de données) : theia-ozcar.gricad-pages.univ-grenoble-alpes.fr/doc-producer/producer-documentation.html
• Guide utilisateur pour créer un jeu de données à partir des Chroniques BDOH et le télécharger dans Theia/OZCAR IS. : nextcloud.inrae.fr/s/pSTgPPERoPBAKwH
L’objectif du Système d’Information (SI) Theia/OZCAR est de rendre visible l’ensemble des données in-situ d’observation des surfaces continentales et d’en faciliter la découverte et l’accès sur un portail unique géré par le pôle de données des surfaces continentales Theia, en commençant par les observatoires labellisés faisant partie de l’IR OZCAR (Observatoires de la Zone Critique : Observation et Recherche), avant de l’étendre à des données provenant d’autres sources (programmes de recherche, observatoires non labellisés). Le SI en cours de développement s’appuie sur les standards d’échange de données (INSPIRE, OGC) et s’attache à mettre en œuvre les principes FAIR, notamment pour préparer la communauté française à intégrer les infrastructures européennes comme eLTER-RI (European Long Term Ecological Research), récemment acceptée sur la feuille de route européenne et dont le miroir français eLTER-France inclut l’IR OZCAR. Le SI permettra également l’attribution de DOI de données.
L'IR OZCAR coordonne 21 observatoires labellisés qui gèrent une soixantaine de sites en France et à l'étranger (Afrique du Nord et de l’Ouest, Asie, Amérique du Sud, Arctique) qui vont de quelques hectares à plusieurs centaines de km². Ces observatoires recueillent des données in situ des surfaces continentales sur le long-terme, dont certaines démarrent dès 1960. Les pratiques et les objectifs initiaux des observatoires sont différents, ce qui a conduit à des choix de protocoles d'échantillonnage et de capteurs de mesure différents. Dans le recensement actuel il y a plus de 300 variables mesurées par les observatoires d’OZCAR (comprenant à la fois des variables physiques et des espèces chimiques). Les données in situ sont principalement des séries temporelles, mais également des données grillées, des données vectorielles, ou des profils 2D.
La complexité du SI Theia/OZCAR réside moins dans le volume total des données stockées (environ 10 To), que dans la variété des données et métadonnées nécessaires pour les contextualiser (variables, objets d'intérêt, méthodes d’acquisition) ; ainsi que dans l’hétérogénéité des systèmes d’information distribués déjà existants pour décrire et diffuser les données de chaque observatoire.
Pour développer le SI Theia/OZCAR il a été choisi, en accord avec l’expérience de l’IR Système Terre, de laisser les données au plus près des producteurs pour en assurer la qualité. Les observatoires continuent à distribuer leurs données dans les SI qu'ils ont développés et un modèle de données pivot avec des métadonnées riches basées sur des standards a été défini pour assurer les flux d’informations entre les observatoires et le SI Theia/OZCAR et assurer la fairisation des données. Cette approche itérative crée un réseau et permet de s’appuyer sur les compétences complémentaires en termes de gestion des données des observatoires. Un prototype de portail, ciblé sur les séries temporelles ponctuelles, est disponible et un tiers des observatoires ont déjà implémenté les flux d’informations avec le SI Theia/OZCAR. Le projet FairTOIS vise à consolider et à enrichir le travail d’implémentation des principes FAIR démarré depuis deux ans pour permettre : (1) la découverte des données à travers des noms de variables et objets d’intérêt standardisés ainsi que l’accès aux données, (2) le développement de l’interopérabilité des données, et (3) la dissémination des principes du FAIR data dans la communauté des surfaces continentales via les membres de l’IR OZCAR. L’ensemble de ces développements sera mené, comme pour les développements actuels, en lien avec l’IR Système Terre et les pôles de données des autres disciplines pour veiller à l’interopérabilité des systèmes et des données. Le travail réalisé permettra aussi à la communauté française d’être force de proposition pour la construction du SI d’eLTER, en ayant déjà une vision partagée de la gestion d’un panel de données beaucoup plus large que celui actuellement traité dans eLTER.
Coordination du projet
Sylvie GALLE (Institut des Géosciences de l'Environnement)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
OSUG Observatoire des Sciences de l'Univers
IGE Institut des Géosciences de l'Environnement
Irstea - RiverLy Irstea - RiverLy
Aide de l'ANR 96 010 euros
Début et durée du projet scientifique :
février 2020
- 24 Mois