Réseau Incertitude et Apprentissage – UML-NET
Réseau sur l'apprentissage en présence d'incertitude
Ce projet vise à créer un réseau européen centré sur la problématique d'apprentissage automatique en présence d'incertitudes fortes, et centré sur deux problématiques:<br /><br />* La gestion de données imparfaites (imprécises, bruitées) ou peu volumineuse durant l'apprentissage<br /><br />* L'intérêt et les méthodes pour produire des modèles prudents, ou la prudence est modélisée par la considération d'ensembles de modèles.
Construction d'un réseau Européen
Les objectifs principaux sont les suivants:<br /><br />* Permettre à des chercheurs ayant des approches variées de confronter et de discuter de ces dernières.<br /><br />* Fédérer une communauté de chercheurs intéressé par la gestion des incertitudes sévères dans les problèmes d'apprentissage automatique.
* Organisation d'ateliers impliquant les différents chercheurs du projet, et plus largement les chercheurs interessés par la thématique.
* Séjours de recherche (courts et longs) entre membres du réseau
* Deux ateliers WUML (Workshop on Uncertainty in Machine Learning) en 2015 et 2017
* Meilleur papier à la conférence SMPS 2016 («Technical Gestures Recognition by Set-Valued Hidden Markov Models with Prior Knowledge«)
* Soumission d'un projet COST
* Assurer la continuité du réseau au travers de la soumission de projets.
* Y. Soullard, A. Antonucci, S. Destercke, «Technical Gestures Recognition by Set-Valued Hidden Markov Models with Prior Knowledge«
Les systèmes d'information modernes et les données qu'ils manipulent deviennent de plus en plus complexes. C'est le cas, par exemple, pour les protéines et leur fonctionnalité, pour l'extraction d'information à partir de texte, pour la recommendation en ligne à partir de préférence, pour le diagnostique et le suivi de systèmes complexes (réseaux d'énergie, ...). Cette complexité signifie également qu'obtenir des données et des modèles fiables est de plus en plus difficile. En particulier, les données disponibles sont souvent bruitées ou incomplètes.
Manipuler de telles données tout en préservant l'efficacité des méthodes d'apprentissage revient souvent à sacrifier un peu de qualité de prédiction. Alors que cette perte contrebalancés par plus d'efficacité calculatoire est acceptable dans certains cas (systèmes de recommandations, requêtes internet), un tel compromis reste inacceptable dans d'autres tel que l'analyse de risque ou le diagnostique médical. Pour de telles applications, de récentes et prometteuses directions de recherche se propose de mieux intégrer l'incertitude à la méthode d'apprentissage, en sacrifiant parfois l'efficacité pour obtenir des résultats plus fiables, par exemple en permettant au modèle de faire des prédictions partielles (imprécises) mais plus fiables, ou en traitant l'incertitude des données de manière conservative. Le but du présent projet et réseau est de renforcer les collaborations entre les groupes de recherche français et européens travaillant sur ce type d'approches selon différends points de vue, afin de pouvoir échanger et d'établir des bases communes de ce domaine émergent, dans le but final de construire un réseau européen spécialisé sur ces aspects. Le but du projet est de poser les premières pierres de cet édifice, notamment via l'organisation de groupes de travail oud'événements divers (numéros spéciaux, sessions spéciales), ainsi que par l'échange de chercheurs et d'étudiants.
Le réseau se focalisera sur deux sujets principaux. Le premier concerne le problème d'apprendre des modèles en présence de données incertaines, quye ce soit en entrée ou en sortie (structurée) du modèle. En particulier, le projet se propose d'explorer l'idée d'apprendre un ensemble de modèles depuis les données incertaines plutôt qu'un seul et unique modèle. Dans certains cas, cet ensemble de modèle fournira une prédiction imprécise (mais potentiellement plus fiable), qui sera à comparer aux prédictions obtenues par des méthodes plus classiques.
Le deuxième sujet ne concerne pas les données incertaines mais le fait d'intégrer la notion de prudence au sein du modèle et des décisions prises à partir de ce dernier. Plus précisément, nous comprenons ici le terme de prudence comme le fait de produire un ensemble de modèle ou un ensemble de prédiction quand l'incertitude est trop importante, par exemple quand la quantité de données disponible est insuffisante. Deux problématiques liées à cet aspect sur lesquelles le projet se focalisera sont (1) comment peut être exploitée cette prudence intégrée aux modèles et décisions et (2) comme cette prudence peut-elle être intégrée à l'apprentissage de manière efficace, c'est-à-dire sans demander des efforts calculatoires supplémentaires trop importants.
Coordination du projet
Sébastien Destercke (Laboratoire Heuristique et Diagnostic des Systèmes Complexes)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
IDSIA Dalle Molle Institute for Artificial Intelligence - Imprecise probability group
University of Paderborn - Intelligent Systems Group
Université d'Oviedo - Equipe Métrologie et modèles
BGE Unité Biologie à grande échelle
Heudiasyc Laboratoire Heuristique et Diagnostic des Systèmes Complexes
Aide de l'ANR 52 000 euros
Début et durée du projet scientifique :
janvier 2015
- 24 Mois