Réseau profond génératif médicalement explicable pour l'analyse de données cliniques – BIODEEP
Ce projet interdisciplinaire vise à développer de nouvelles méthodes en mathématiques et en informatique pour stratifier les patients en groupes homogènes basés sur des variables biologiques, c’est-à-dire des biomarqueurs. Cette approche serait particulièrement utile dans le domaine de la psychiatrie où il est maintenant établi que des patients présentant les mêmes symptômes, par exemple la schizophrénie, souffrent en fait de pathologies différentes. Il s’agit de développer un algorithme de multi-partitionnement à base de données biologique pour découvrir de nouvelles interprétations cliniques. Pour atteindre cet objectif, nous utiliserons deux jeux de données composés des variables cliniques et biologiques de deux cohortes de patients schizophrènes, FACE-SZ et OPTiMiSE. Les variables biologiques, essentiellement des biomarqueurs obtenus par analyse d’un prélèvement sanguin, serviront à prédire les variables cliniques, notamment les scores cliniques établis par des psychiatres.
Dans ce projet, nous développerons un réseau de neurones profond génératif pour le partitionnement multi-facettes des données biologiques. Une facette correspond à un partitionnement particulier qui permet de regrouper les patients en fonction de caractéristiques communes dans leurs échantillons biologiques. En apprenant simultanément plusieurs facettes, les médecins et les biologistes pourront découvrir de novo différentes façons de stratifier les patients. Ils pourraient alors découvrir de nouveaux traits communs partagés par les patients analysés et améliorer leur prise en charge. Nous espérons que certains de ces traits correspondront à des variables cliniques couramment utilisées par les psychiatres.
L’architecture du réseau de neurones sera construite, de façon non-supervisée, sur le modèle d’un autoencodeur variationnel. Le projet vise trois innovations majeures : 1) apprendre des variables latentes qui correspondent à des transformations non-linéaires pertinentes des données biologiques, 2) modéliser les dépendances entre les variables latentes avec un réseau bayésien graphique et 3) construire un réseau de neurones pour le multi-partitionnement dont l’architecture respecte la structure du classifier de Bayes optimal.
Les variables latentes permettront aux médecins et aux biologistes d’identifier les combinaisons de variables biologiques permettant de stratifier au mieux les patients en fonction de données biologiques objectives. Le réseau bayésien, particulièrement pertinent pour modéliser les dépendances statistiques entre des variables, servira de méta-modèle qui guidera la connectivité entre les neurones et les couches au sein du réseau neuronal profond. Ce type de réseau graphique, souvent utilisé dans le domaine de la santé, facilitera les échanges entre médecins, biologistes et experts en apprentissage automatique. Enfin, la conception d’un classifieur de Bayes optimal nous permettra d’avoir les meilleures performances possibles en matière de prédiction et d’exploiter au mieux l’information contenue dans les bases de données.
Outre son intérêt dans les domaines du traitement du signal, des mathématiques et des statistiques, notre projet aurait des retombées importantes dans le domaine médical puisqu’il permettrait de stratifier des patients présentant les mêmes symptômes sur la base de biomarqueurs sanguins mesurables de manière objective. Il serait alors possible de prescrire aux patients appartenant à la même classe le traitement le mieux adapté selon le principe de médecine personnalisée.
Coordination du projet
Lionel FILLATRE (Laboratoire informatique, signaux systèmes de Sophia Antipolis)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
I3S Laboratoire informatique, signaux systèmes de Sophia Antipolis
IPMC Institut de pharmacologie moléculaire et cellulaire
FondaMental Fondation FONDAMENTAL
Aide de l'ANR 292 151 euros
Début et durée du projet scientifique :
mars 2024
- 42 Mois