CE23 - Données, Connaissances, Big data, Contenus multimédias, Intelligence Artificielle

Analyse et fouille du réseau d'utilisateurs de bitcoin – BITUNAM

Analyse de réseau de transaction Bitcoin

Dans ce projet, nous analysons les données des transactions Bitcoin telles qu'elles peuvent être lues dans la Blockchain. L'objectif est d'étudier Bitcoin en tant que système socio-technique, à la manière de ce qui peut être fait avec des plateformes de réseau social telles que Facebook ou Twitter.

Comment comprendre les données de la blockchain Bitcoin

Analyser les données de Bitcoin est complexe, d'une part en raison de la taille des données (centaines de Millions de transactions), mais aussi de la pseudonymité de ses acteurs, ainsi que simplement du manque de connaissance que nous avons de l'activité des acteurs et de leurs rôles. Le but de ce projet est donc justement de répondre à certains de ces problème de manière à pouvoir identifier et interpréter les activités qui caractérisent l'économie Bitcoin.

Nous utilisons une combinaison de Machine Learning et d'approche de science des réseaux (Network science), à la fois pour comprendre les données (par exemple, désaonymisation d'acteurs), ainsi que pour les interpréter.

Ce projet est encore en cours, mais nous proposons déjà une vue générale des données que nous analyson sur un site web pédagogique:
bitunam.sci-web.net

Notre objectif, après avoir atteind nos objectifs, sera de publier notre jeu de données enrichi grâce aux connaissances acquises pour que tout le monde puisse l'utiliser dans leurs propres travaux.

1. Remy Cazabet, Souâad Boudebza, Giulio Rossetti, Evaluating community detection algorithms for progressively evolving graphs, Journal of Complex Networks, Volume 8, Issue 6, 1 December 2020, cnaa027, doi.org/10.1093/comnet/cnaa027
2. Vaudaine, R., Cazabet, R., & Largeron, C. (2020, April). Comparing the preservation of network properties by graph embeddings. In International Symposium on Intelligent Data Analysis (pp. 522-534). Springer, Cham doi.org/10.1007/978-3-030-44584-3_41
3. Duvivier, L., Robardet, C., & Cazabet, R. (2019, December). Minimum entropy stochastic block models neglect edge distribution heterogeneity. In International Conference on Complex Networks and Their Applications (pp. 545-555). Springer, Cham. doi.org/10.1007/978-3-030-36687-2_45
4. Boudebza, S., Cazabet, R., Nouali, O., & Azouaou, F. (2019, September). Detecting Stable Communities in Link Streams at Multiple Temporal Scales. In Joint European Conference on Machine Learning and Knowledge Discovery in Databases(pp. 353-367). Springer, Cham. doi.org/10.1007/978-3-030-43823-4_30
5. Duvivier, L., Cazabet, R., & Robardet, C. (2020, December). Edge Based Stochastic Block Model Statistical Inference. In International Conference on Complex Networks and Their Applications (pp. 462-473). Springer, Cham. doi.org/10.1007/978-3-030-65351-4_37

Bitcoin et les autres crypto-monnaies rencontrent un succès de plus en plus important, avec par exemple une capitalisation de près de 150 milliards de dollars (Mars 2018) pour le seul Bitcoin. Toutes les données concernant l'ensemble des transactions effectuées avec ces crypto-monnaies sont librement accessibles, car elles sont stockées dans une base de données distribuée, la blockchain. Malgré cela, les activités qui y sont menées ainsi que les acteurs du système sont très peu connus. Une raison est que les acteurs ne sont pas directement identifiables dans la blockchain, due à un système d'anonymisation. Des travaux récents ont montré que des techniques de fouille de données utilisant l'analyse de réseaux permettaient, dans une certaine mesure, de retracer l'activité des acteurs. Nous proposons donc de travailler sur la caractérisation des acteurs et des usages des crypto-monnaies, ce qui requiert des avancées en matière de fouille de grands réseaux dynamiques. Par l’identification de la nature des activités, nous pourrons évaluer à quel point Bitcoin est utilisé pour la spéculation, des activités illégales ou des achats légaux, et répondre à la question controversée de son statut ou non de véritable monnaie.
Le projet contient un volet interdisciplinaire, avec la collaboration de deux socio-économistes spécialistes de la monnaie et des monnaies alternatives. Notre ambition est de former et d’animer une communauté scientifique autour de l’analyse, via des outils de la science des données et des Big Data, de ces nouvelles formes de monnaies, qui ont le potentiel d’apporter des changements profonds à nos économies et nos sociétés dans les prochaines années.

Coordination du projet

Remy Cazabet (UMR 5205 - LABORATOIRE D'INFORMATIQUE EN IMAGE ET SYSTEMES D'INFORMATION)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIRIS UMR 5205 - LABORATOIRE D'INFORMATIQUE EN IMAGE ET SYSTEMES D'INFORMATION

Aide de l'ANR 150 595 euros
Début et durée du projet scientifique : - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter