Processus massivement participatifs d'acquisition de données et de connaissances – HEADWORK
Résumé du projet
Le crowdsourcing désigne le recours à une masse (potentiellement très grande) de participants via Internet
pour résoudre des tâches d'acquisition ou d'analyse de données. Il s'agit d'une technologie en pleine expansion
impactant de nombreux domaines, depuis l'enrichissement de connaissances scientifiques jusqu'à l'analyse marketing.
Mais actuellement, les plate-formes de crowdsourcing existantes s'appuient principalement sur des langages de programmation bas-niveau,
des modèles de données rigides et une modélisation simpliste des participants, ce qui engendre plusieurs inconvénients. La nature bas-niveau
des solutions existantes freine la conception de workflows complexes d'analyse de données, pouvant être exécutés, composés, analysés, voire proposés par les participants eux-mêmes. Prendre en compte la qualité, l'incertitude, l'inconsistence ou la représentativité des contributions des participants est également un problème ouvert. Peu de méthodes existent pour affecter des tâches au meilleur participant selon son profil (niveau de confiance, sa motivation, son expertise) ou pour automatiquement optimiser le temps d'exécution ou la meilleure politique d'incitation pour les participants. De manière similaire, les campagnes de crowdsourcing existantes peuvent produire des jeux de données rigides et isolés. Un modèle de données flexible et commun pour la connaissance produite sur les données et les participants faciliterait ainsi l'acquisition participative de connaissances.
Pour répondre à ces défis, Headwork proposera :
- des modèles expressifs des workflows, des participants, des données et des connaissances, afin de capturer différents scénarios de crowdsourcing pour des tâches complexes d'acquisition de données, en prenant en compte la spécificité des participants humains,
- des méthodes pour déployer, vérifier, optimiser, mais aussi pour surveiller et adapter les workflows participatifs à l'exécution.
Pour cela, Headwork s'appuiera sur deux membres experts des plateformes participatives d'acquisition de connaissances (MNHN-Cesco & FouleFactory, académiques et industriels), sur des équipes centrales en gestion e données et modélisation de workflows (Dahu, Druid, Links, Sumo)...et sur une cohorte d'environ 60 000 participants enregistrés sur nos plateformes.
Coordination du projet
David GROSS AMBLARD (Institut de recherche en Informatique et Systèmes aléatoires)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
Inria Lille - Nord Europe Inria Lille - Nord Europe
INRIA CENTRE RENNES - BRETAGNE ATLANTIQUE INRIA CENTRE RENNES - BRETAGNE ATLANTIQUE
Inria Saclay - Ile-de-France - équipe DAHU Inria - Centre de recherche Saclay - Ile-de-France - Equipe projet DAHU
LOTOMATE
MNHN MNHN
IRISA Institut de recherche en Informatique et Systèmes aléatoires
Aide de l'ANR 798 132 euros
Début et durée du projet scientifique :
September 2016
- 48 Mois