DS0708 - Données massives, connaissances, décision, calcul haute performance et simulation numérique

Réseau Données Massives et Connaissances – MDK

Résumé de soumission

Dans différents domaines d'applications, les données manipulées atteignent une échelle sans précédent, au point où il devient impossible de les traiter avec les outils classiques. Ceci a conduit à l’émergence du phénomène Big Data nécessitant de nouveaux outils pour la collecte, la valorisation et l’interrogation des données.

Les données hétérogènes collectées de façon massive ou à la volée, doivent en effet être nettoyées, croisées et enrichies, filtrées et agrégées, visualisées, analysées et fouillées pour constituer in fine des produits riches en sémantique et stratégiques pour l’analyse et la prise de décision ou la compréhension des phénomènes sous jacents. Nous passons d’un déluge de données à des océans de connaissances avec, au cœur de cette transition, de nouvelles avancées scientifiques et technologiques, porteuses d’innovations dans le monde socio-économique et scientifique. Offrir un support au continuum «données-informations-connaissances-décisions» nécessite :
• de gérer, organiser, accéder à des masses de données issues de nombreuses sources différentes (Volume), présentant de grandes différences en terme de contenu, de structure et de sémantique (Variété), dont le taux de variation est élevé (Velocity) et dont la qualité est plus ou moins garantie/attestée (Veracity),
• d’en extraire des connaissances pertinentes et de la valeur ajoutée par analyse et fouille. La présence d'imprécisions, d'incohérences, d'erreurs, d’expression d'opinions, etc. rend difficile la découverte de connaissances ou la prise de décision.
Dans le domaine des STIC, les principales communautés scientifiques concernées par ces défis sont celles de la gestion de données (ou bases de données), de la recherche d’information, des statistiques et de l’analyse de données, de la découverte de connaissance à partir de données, de l’apprentissage, de l’intelligence artificielle, ou encore de la visualisation.

Le réseau MDK a pour objectif de donner un cadre à une réflexion collective, par l’ensemble de ces communautés, sur la recherche et l’innovation dans le domaine des Masses de Données et Connaissances. Il s’agit de produire des études prospectives, de donner des recommandations et de proposer des Actions concrètes. Cette réflexion pourra s’accompagner d’une stratégie tant sur le plan national qu’européen.

Coordination du projet

Christine COLLET (Laboratoire d'Informatique de Grenoble)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIG-CNRS Laboratoire d'Informatique de Grenoble

Aide de l'ANR 52 075 euros
Début et durée du projet scientifique : novembre 2014 - 12 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter