CHIST-ERA - 2nd appel à projets de l’ERA-Net CHIST-ERA 2012

Extraction de Connaissances et Crédibilité Utilisateurs pour le Multimédiz – MUCKE

Résumé de soumission

Le Web 3.0 a fait son apparition dans le discours courant il y a environ cinq ans. Même si sa définition reste floue, ce qui est devenu clair pendant cette demi décennie est que les média sociaux prennent de plus en plus importance sur le Web. Les utilisateurs utilisent une multitude d'appareils (tablette, smartphones, appareils photos, ordinateurs) pour partager des données multimédia avec d'autres utilisateurs ou avec un public plus large. MUCKE propose la mise en œuvre d'algorithmes d'extraction de connaissances innovants et robustes afin de traiter les données multimédia partagées sur les réseaux sociaux. L'approche proposée diffère de celles existantes, qui sont principalement quantitatives, par une grande importance donnée à la qualité des données traitées. Cette dimension qualitative est implémentée à travers deux innovations centrales : l'estimation automatique de la crédibilité des utilisateurs et la similarité adaptative des concepts multimédia. Les modèles de crédibilité, un sujet nouveau traité comme un problème de fusion d'information multimédia, vont constituer la principale contribution scientifique du projet. La similarité adaptative des concepts multimédia se distingue des modèles existants par un traitement sémantique des corpus traités qui seront représentés via des modèles probabilistes. L'utilité de ces deux innovations sera validée dans un système de recherche d'images. Des évaluations extensives sur des jeux de données reconnus seront menées pour examiner la qualité des connaissances extraites. De plus, une nouvelle tâche d'évaluation dédiée à la crédibilité sera proposée. Les deux principales nouveautés du projet seront basées sur des méthodes innovantes de traitement d'informations textuelles et visuelles, ainsi que sur la fusion de ces informations. Les traitements textuels seront focalisés sur la désambiguïsation, la reconnaissance de concepts et la résolution d'anaphores. Les traitements d'images incluront les représentations parcimonieuses, la détection de concepts à large échelle et la robustesse des détecteurs. La fusion multimédia sera focalisée sur la combinaison flexible texte-image basée sur des modèles probabilistes. Toutes les méthodes proposées vont exploiter les propriétés structurelles des réseaux sociaux. Une attention particulière sera accordée à la proposition d'algorithmes qui passent à l'échelle afin de pouvoir traiter des données hétérogènes à large échelle. Le consortium est composé de quatre partenaires, trois universités et un institut de recherche qui ont des compétences complémentaires couvrant les différents domaines scientifiques associés au projet. Dans le cadre de MUCKE, ils vont introduire de nouveaux modèles pour le traitement de données multimodales et multilangues qui constitueront la base de futurs services innovants.

Allan HANBURY (Vienna University of Technology - Institute for Software Technology and Interactive Systems)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

TUW IFS Vienna University of Technology - Institute for Software Technology and Interactive Systems
CEA LIST Commissariat à l'énergie atomique et aux énergies alternatives
BILKEN Bilkent University - Department of Computer Engineering
UAIC Alexandru Ioan Cuza University - Faculty of Computer Science

Aide de l'ANR 273 322 euros
Début et durée du projet scientifique : décembre 2012 - 36 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.