DS0707 - Interactions humain-machine, objets connectés, contenus numériques, données massives et connaissance

Fields: Recherche d'événements intéressants dans les grands réseaux sociaux – FIELDS

Résumé de soumission

Une grande quantité de données est partagée par les utilisateurs de médias sociaux comme Twitter, Facebook, Google+. Cela offre des opportunités inédite, car elle permet d'étudier et de comprendre des systèmes complexes, ainsi que, d'être informé en temps réel sur des événements récents, tels que les tremblements de terre, les épidémies de virus ou un nouveau concert de jazz. Cependant, elle pose des défis non négligeables en raison de la taille de ces données, son évolution rapide au cours du temps et le fait que l'information pertinente est souvent liée à des données bruyantes ou non intéressantes. Lorsque des événements, tels que la récente fusillade dans les bureaux de Charlie Hebdo se déroulent, les utilisateurs de reseaux sociaux se engagent dans une activité sociale intense par discuter et partager des informations dans la forme de textes, photos, etc. Dans Twitter, tweets contenant des termes tels que `` Charlie Hebdo '', ``fusillade'', `` Paris '' devient relativement fréquentes. Dans Flickr (un site web pour partager des photos), les utilisateurs postent des photos étant étiqueté avec des termes tels que `` Place de la République '', `` Je suis Charlie '', `` marche pour Charlie ''. Dans Tumblr (une plate-forme de micro-blogging) les blogueurs ajoutent des liens vers d'autres blogs liés à l'événement. L'objectif de cette proposition est de concevoir des algorithmes pour trouver des événements intéressants dans une manière automatique en analysant l'énorme quantité de données produites dans les réseaux sociaux. Twitter, Flickr, Tumblr, sont intrinsèquement dynamique avec de nouveaux tweets, photos, liens étant souvent affichés ou supprimés. Il est par conséquent nécessaire de concevoir des algorithmes dynamiques qui peuvent être efficacement mises en œuvre dans des systèmes tels que Spark, Storm, MapReduce ou Pregel.

Coordination du projet

Mauro Sozio (Institut Mines Telecom)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LTCI Telecom ParisTech Institut Mines Telecom

Aide de l'ANR 207 569 euros
Début et durée du projet scientifique : septembre 2015 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter