VERSO - RESEAUX DU FUTUR ET SERVICES

Partage de données en P2P pour communautés en ligne – DATARING

Résumé de soumission

Le projet DataRing aborde le problème de partage de données en pair-à-pair (P2P) pour des communautés virtuelles (online communities), en offrant un anneau de haut niveau reliant les fournisseurs de sources de données distribuées. Les utilisateurs peuvent être nombreux et intéressés par différentes formes de collaboration et le partage de connaissance, idées, expériences, etc. Les sources de données peuvent être nombreuses aussi, très autonomes, c’est-à-dire sous fort control local des fournisseurs, et très hétérogènes avec différentes structures et sémantiques. En nous appuyant sur une approche P2P, il nous faut alors concevoir de nouvelles techniques de gestion de données décentralisées qui passent à l’échelle tout en supportant l’autonomie, le comportement dynamique et l’hétérogénéité des utilisateurs et des sources de données. Les membres des communautés peuvent être des utilisateurs volontaires qui donnent leur temps à un projet commun. Ils peuvent être aussi des professionnels (chercheurs, ingénieurs, personnel support, etc.) qui utilisent la collaboration web à l’intérieur ou entre leurs entreprises. Ainsi, les avantages de la collaboration massive tels que production plus rapide et meilleure précision des connaissances et des données peuvent être apportés à toutes sortes d’entreprises, et par exemple, les aider à créer des produits avec un meilleur rapport qualité/coût. Deux exemples représentatifs de communautés en ligne qui nous intéressent dans ce projet sont la recherche médicale collaborative et les réseaux sociaux. Notre analyse de l’état de l’art en gestion de données révèle qu’aucune solution existante ne peut adresser tous les besoins des communautés virtuelles. Mais chaque solution peut nous apporter des concepts et des techniques utiles : les extensions récentes des SGBD avec requêtes topk , le concept de dataspace avec le principe pay-as-you-go pour l’intégration de données à grande échelle , les capacités de passage à l’échelle des systèmes P2P, en particulier l’indexation avec les tables de hachage distribuées (DHTs). Nous voyons quatre grands défis pour produire la nouvelle génération de systèmes de partage de données P2P pour des communautés virtuelles : traitement de requêtes avec des données incertaines, intégration de données sémantique, réplication de données et gestion de cache, confidentialité des données. Nous proposons d’adresser ces défis avec quatre objectifs principaux: 1. Concevoir de nouvelles techniques de partage de données qui supportent les besoins des communautés virtuelles. Ces techniques doivent s’appuyer sur un modèle de données incertaines et un modèle de confidentialité pour un environnement P2P. 2. Démontrer la supériorité des techniques proposées par implémentation et simulation. 3. Proposer une architecture DataRing avec des composants qui implémentent les techniques proposées. 4. Valider l’architecture DataRing en implémentant des composants et services majeurs en logiciel libre. La validation devra aussi démontrer des éléments clés de l’architecture avec deux applications de communautés virtuelles (par ex. une application de recherche médicale collaborative et un réseau social).

Coordination du projet

Patrick VALDURIEZ (Organisme de recherche)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Aide de l'ANR 594 860 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter