Apprentissage des modèles interprétables pour le diagnostic médical – DiagnoLearn
Un problème central dans l'utilisation pratique des modèles statistiques réside dans leur manque d'interprétabilité. Les scores de risques sont des modèles très utilisés en médecine, car souvent définis comme modèles linéaires parcimonieux où les coefficients ont peu de chiffres significatifs ou sont même des nombres entiers. Idéalement, un score est précis et basé sur des opérations arithmétiques simples, est parcimonieux, et peut de ce fait être facilement appréhendé par des experts humains. Dans ce projet, nous proposons d’automatiser la construction de tels modèles qui sont encore construits manuellement en particulier dans des applications médicales. Notre objectif est d'introduire une méthodologie originale pour apprendre à la fois une sélection des variables, leur meilleure discrétisation, et les poids optimaux permettant un score optimal. Nous proposons d’introduire des cascades de scores afin de prendre en compte les coûts d'acquisition des données et des coûts associés aux possibles erreurs de diagnostic. Le projet est interdisciplinaire, car à l'intersection de l'apprentissage statistique, de l’aide à la décision, de l'optimisation et de la médecine personnalisée. DiagnoLearn fédère les chercheurs dont l'expertise couvre tous ces domaines mentionnés.
Coordinateur du projet
Madame Nataliya Sokolovska (Unité de recherche sur les maladies cardiovasculaires, le métabolisme et la nutrition)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
UMR_S1166 Unité de recherche sur les maladies cardiovasculaires, le métabolisme et la nutrition
Aide de l'ANR 266 760 euros
Début et durée du projet scientifique :
décembre 2017
- 36 Mois