Classifieur Minimax pour la détection d'anomalies en présence de distributions incertaines des données – DMC
La classification supervisée devient de plus en plus prometteuse dans plusieurs applications réelles telles que la médecine de précision ou la détection d'anomalies. A partir de variables descriptives numériques et/ou catégorielles, d'images ou de tout autre type de signaux décrivant chaque observation, l'objectif est de prédire la véritable classe de futurs échantillons afin d'accompagner les experts du domaine d'application dans leurs diagnostics.
Cependant, trois problèmes importants surviennent souvent dans de telles applications réelles : (i) la présence de classes déséquilibrées qui conduisent généralement la plupart des classifieurs à être imprécis pour détecter les plus petites classes, (ii) la présence de changements de probabilité a priori qui endommagent la classification, (iii) la présence d'incertitudes quant à la distribution des variables descriptives ce qui peut endommager le risque d'erreur de classification de tout classifieur.
Selon la littérature, le classifieur minimax est théoriquement conçu pour être le plus robuste face aux ensembles de données déséquilibrés et aux changements de probabilité a priori puisqu'il s'agit d'un classifieur Bayésien qui minimise le maximum des risques conditionnels par classe.
Le premier objectif de notre présente proposition est d'aborder la question des changements de distributions au sein des variables descriptives afin de rendre le classifieur minimax plus robuste face ces incertitudes.
Deuxièmement, nous visons également à étendre ces recherches aux tâches de classification multi-étiquettes dans lesquelles ces trois problèmes se produisent souvent également dans les applications critiques.
Coordination du projet
Cyprien Gilet (Heuristique et diagnostic des systèmes complexes)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
HEUDIASYC Heuristique et diagnostic des systèmes complexes
Aide de l'ANR 315 401 euros
Début et durée du projet scientifique :
septembre 2024
- 48 Mois