CHIST-ERA Call ORD - CHIST-ERA Call Open & Re-usable Research Data & Software (ORD) 2023

Infrastructure de données blockchain équitable et modulaire pour une science et une société ouvertes – FairOnChain

Résumé de soumission

Les blockchains publiques, telles que Bitcoin et Ethereum, sont publiquement consultables par nature, mais leurs données ne peuvent être facilement examinées et analysées qu’à l’aide d’une structuration et une indexation appropriées. L'objectif de ce projet est de développer une infrastructure ouverte qui permet d'accéder facilement aux données des blockchains et de les rechercher, conformément aux principes FAIR de l’open science. Cela favorisera une transparence et une reproductibilité complètes des résultats d'analyses scientifiques dans le domaine de la blockchain - ce qui n'existe pas aujourd'hui - facilitant ainsi la croissance des applications et des collaborations nouvelles et existantes.

À présent, les analyses structurées sont généralement effectuées à l'aide de solutions et de bases de données propriétaires, ce qui rend la reproductibilité et le partage des données au sein de la communauté scientifique difficiles et coûteux. En outre, même si les études scientifiques mettent souvent en œuvre des opérations similaires pour collecter des données de manière systématique, les outils et les librairies logiciels développés sont rarement partagés. Par conséquent, des travaux de recherches similaires menées par des institutions et des groupes différents nécessitent souvent la réimplémentation des mêmes outils logiciels, ce qui entraîne un gaspillage de ressources et une incapacité à reproduire et comparer les résultats.

Dans le cadre de ce projet, nous prévoyons de fournir à la communauté scientifique:
(a) Une infrastructure accessible au public et extensible qui comprendra des données de transaction de blockchain structurées et mises à jour quotidiennement. Les chercheurs pourront accéder aux données de transaction brutes et aux ensembles de données enrichis maintenus par la communauté de manière uniforme et ouverte, favorisant la disponibilité et la réutilisation de ces données complexes.
(b) Une structure logiciel open source et des API d'accès aux données qui permettra d'interroger, d'annoter et de référencer efficacement les données, et de construire des flux de travail réutilisables et bien documentés qui faciliteront l'échange et la réplication des résultats scientifiques selon les principes FAIR.

Ce projet vise également à fournir une solution et un outil efficaces à la Commission européenne pour certifier les transactions blockchain comme l'exigent les règles fiscales européennes récemment votées (08/12/2022), également connues sous le nom de «?eighth Directive on Administrative Cooperation?» (DAC8), et pour lesquelles il n'existe pas encore de solution publique et généralement acceptée.


Selon Google Scholar, plus de 547 000 articles scientifiques ont été publiés en utilisant le mot-clé "blockchain" et 13 000 en utilisant la combinaison "blockchain data" depuis 2013. Ces chiffres sont en forte croissance ces dernières années. Cependant, seuls c.a. 200 jeux de données associés à ces études ont été identifiés et sont accessibles au public?: qualité et fiabilité de ces données sont généralement inconnues. Cela met en évidence le besoin urgent d'une base de données de référence pour la recherche qui soit libre et réutilisable et d'une solution logicielle dans le domaine de la blockchain et de l'analyse des données. Dans d'autres domaines de recherche tels que les soins de santé, les biosciences, la physique des particules, les géosciences et l'astrophysique, il existe des méthodes, des outils logiciels open source et des bases de données accessibles et entretenues par le public (par exemple, UK Biobank, UniProt, CERN Open Data, ESA Gaia Archive, système de données planétaires de la NASA) où les chercheurs peuvent collecter et partager leurs données. Cependant, ce n'est pas le cas actuellement dans le domaine des données blockchain : pour cette raison, l'objectif de ce projet est de combler cette lacune et de fournir une solution efficace et acceptable par le public.

Coordination du projet

Julien Prat (Centre de Recherche en Economie et Stastistique - CREST)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

EPFL / SCI STI MM École Polytechnique Fédérale de Lausanne
HEG / HES-SO Haute École de Gestion de Genève - HES-SO
CREST Centre de Recherche en Economie et Stastistique - CREST
ICL Imperial College London

Aide de l'ANR 135 597 euros
Début et durée du projet scientifique : novembre 2023 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter