DONNEES - Appel flash science ouverte : Pratiques de recherche et données ouvertes

Implémenter les principes FAIR dans le système d'information Theia/OZCAR – FairTOIS

Résumé de soumission

L’objectif du Système d’Information (SI) Theia/OZCAR est de rendre visible l’ensemble des données in-situ d’observation des surfaces continentales et d’en faciliter la découverte et l’accès sur un portail unique géré par le pôle de données des surfaces continentales Theia, en commençant par les observatoires labellisés faisant partie de l’IR OZCAR (Observatoires de la Zone Critique : Observation et Recherche), avant de l’étendre à des données provenant d’autres sources (programmes de recherche, observatoires non labellisés). Le SI en cours de développement s’appuie sur les standards d’échange de données (INSPIRE, OGC) et s’attache à mettre en œuvre les principes FAIR, notamment pour préparer la communauté française à intégrer les infrastructures européennes comme eLTER-RI (European Long Term Ecological Research), récemment acceptée sur la feuille de route européenne et dont le miroir français eLTER-France inclut l’IR OZCAR. Le SI permettra également l’attribution de DOI de données.

L'IR OZCAR coordonne 21 observatoires labellisés qui gèrent une soixantaine de sites en France et à l'étranger (Afrique du Nord et de l’Ouest, Asie, Amérique du Sud, Arctique) qui vont de quelques hectares à plusieurs centaines de km². Ces observatoires recueillent des données in situ des surfaces continentales sur le long-terme, dont certaines démarrent dès 1960. Les pratiques et les objectifs initiaux des observatoires sont différents, ce qui a conduit à des choix de protocoles d'échantillonnage et de capteurs de mesure différents. Dans le recensement actuel il y a plus de 300 variables mesurées par les observatoires d’OZCAR (comprenant à la fois des variables physiques et des espèces chimiques). Les données in situ sont principalement des séries temporelles, mais également des données grillées, des données vectorielles, ou des profils 2D.

La complexité du SI Theia/OZCAR réside moins dans le volume total des données stockées (environ 10 To), que dans la variété des données et métadonnées nécessaires pour les contextualiser (variables, objets d'intérêt, méthodes d’acquisition) ; ainsi que dans l’hétérogénéité des systèmes d’information distribués déjà existants pour décrire et diffuser les données de chaque observatoire.

Pour développer le SI Theia/OZCAR il a été choisi, en accord avec l’expérience de l’IR Système Terre, de laisser les données au plus près des producteurs pour en assurer la qualité. Les observatoires continuent à distribuer leurs données dans les SI qu'ils ont développés et un modèle de données pivot avec des métadonnées riches basées sur des standards a été défini pour assurer les flux d’informations entre les observatoires et le SI Theia/OZCAR et assurer la fairisation des données. Cette approche itérative crée un réseau et permet de s’appuyer sur les compétences complémentaires en termes de gestion des données des observatoires. Un prototype de portail, ciblé sur les séries temporelles ponctuelles, est disponible et un tiers des observatoires ont déjà implémenté les flux d’informations avec le SI Theia/OZCAR. Le projet FairTOIS vise à consolider et à enrichir le travail d’implémentation des principes FAIR démarré depuis deux ans pour permettre : (1) la découverte des données à travers des noms de variables et objets d’intérêt standardisés ainsi que l’accès aux données, (2) le développement de l’interopérabilité des données, et (3) la dissémination des principes du FAIR data dans la communauté des surfaces continentales via les membres de l’IR OZCAR. L’ensemble de ces développements sera mené, comme pour les développements actuels, en lien avec l’IR Système Terre et les pôles de données des autres disciplines pour veiller à l’interopérabilité des systèmes et des données. Le travail réalisé permettra aussi à la communauté française d’être force de proposition pour la construction du SI d’eLTER, en ayant déjà une vision partagée de la gestion d’un panel de données beaucoup plus large que celui actuellement traité dans eLTER.

Coordinateur du projet

Madame Sylvie GALLE (Institut des Géosciences de l'Environnement)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

OSUG Observatoire des Sciences de l'Univers
IGE Institut des Géosciences de l'Environnement
Irstea - RiverLy Irstea - RiverLy

Aide de l'ANR 96 010 euros
Début et durée du projet scientifique : février 2020 - 24 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter