ChairesIA_2019_2 - Chaires de recherche et d'enseignement en Intelligence Artificielle - vague 2 de l'édition 2019

Intégration des représentations et des connaissances sur le cerveau – KARAIB

Intégration des connaissances et représentations sur le cerveau

Les sciences cognitives décrivent des opérations mentales, et l'imagerie cérébrale fonctionnelle offre une fenêtre unique sur les systèmes cérébraux qui sous-tendent ces opérations. Les recherches en neuroimagerie ont permis de mieux comprendre les relations entre structure et fonction. Cependant, l'établissement d'une cartographie cérébrale systématique se heurte à un obstacle : les concepts cognitifs sont mal définis et peuvent ne pas correspondre clairement à l'architecture du cerveau.

Exploiter les resources de neurosciences cognitive grâce à l'apprentissage statistique.

Pour relever ce défi, nous proposons de tirer parti de la croissance rapide des sources de données : les informations de localisation rapportées dans les publications neuroscientifiques, les images du cerveau et leurs annotations partagées comme des ressources ouvertes et quelques jeux de données de référence. Notre objectif ici est de mettre au point des techniques d'apprentissage machine multimodales pour relier ces données sources.<br /><br />Objectif 1 : mettre au point des techniques de représentation des données bruitées, pour coupler des données sur le cerveau avec des descriptions de comportements ou de maladies dans le but d'extraire la structure sémantique.<br /><br />Objectif 2: mettre ces représentations au défi de fournir des explications aux relations observées, dans deux cadres distincts: i) une analyse statistique des associations obtenues ii) l'intégration des ces informations dans un langage spécifique aux neurosciences.<br /><br />Objectif 3 : diffuser des résultats facilement utilisables (atlas du cerveau, ontologies, logiciels) et contribuer à des outils de partage de données en ligne pour la neuroimagerie.

Nous utiliserons 3 types de technologies
* Des techniques de traitement du langage naturel pour extraire des informations de grands corpus de publications.
* Des méthodes d'analyse multivariée pour extraire des informations de jeux de données de neuro-imagerie.
* Des réseaux neuronaux profonds pour construire des représentations intermédiaires qui mélangent des informations provenant de différentes sources d'information (corpus de publications, référentiels d'images).

Nous considérons la modélisation de la réponse partagée, un problème d'apprentissage multi-vues où l'on veut identifier les composantes communes de plusieurs ensembles de données ou de vues. Nous introduisons l'analyse en composantes indépendantes partagées (ShICA) qui modélise chaque vue comme une transformation linéaire de composantes indépendantes partagées contaminées par un bruit gaussien additif. Nous montrons que ce modèle est identifiable si les composantes sont non gaussiennes ou si les variances du bruit sont suffisamment diverses. Nous montrons ensuite que dans certains cas, l'analyse de corrélation canonique multi-set peut récupérer les matrices de démixage correctes, mais que même une petite quantité de bruit d'échantillonnage fait échouer l'ACC multi-set. Pour résoudre ce problème, nous proposons d'utiliser la diagonalisation conjointe après l'ACC multi-sets, ce qui conduit à une nouvelle approche appelée ShICA-J. Nous montrons par des simulations que ShICA-J conduit à de meilleurs résultats tout en étant très rapide à ajuster. Alors que ShICA-J est basé sur des statistiques de second ordre, nous proposons en outre d'exploiter la non-gaussianité des composantes en utilisant une méthode de maximum de vraisemblance, ShICA-ML, qui est à la fois plus précise et plus coûteuse. En outre, ShICA s'accompagne d'une méthode fondée sur des principes pour l'estimation des composantes partagées. Enfin, nous fournissons des preuves empiriques sur des ensembles de données d'IRMf et de MEG que ShICA produit une estimation plus précise des composantes que les autres méthodes.

Nous continuons à développer les modèles génératifs de données d'imagerie cérébrale cognitive.

Nous produisons du logicile open-source et des publications.

Les sciences cognitives décrivent des opérations mentales, et l'imagerie cérébrale fonctionnelle offre une fenêtre unique sur les systèmes cérébraux qui sous-tendent ces opérations. De nombreuses recherches en neuroimagerie ont permis de mieux comprendre les relations entre les fonctions psychologiques et l'activité cérébrale. Cependant, l'agrégation des résultats de neurosciences cognitives pour obtenir une cartographie systématique entre la structure et la fonction se heurte à un obstacle : les concepts cognitifs sont mal définis et peuvent ne pas correspondre clairement à l'architecture du cerveau.

Pour relever ce défi, nous proposons de tirer parti de la croissance rapide des sources de données : les informations de localisation rapportées dans les publications neuroscientifiques, les images du cerveau et leurs annotations partagées comme des ressources ouvertes et quelques jeux de données de référence. Notre objectif principal est de mettre au point des techniques d'apprentissage machine multimodales pour relier ces données sources. Nous le déclinons en trois sous-objectifs:

Objectif 1 : mettre au point des techniques de représentation des données bruitées, pour coupler des données sur le cerveau avec des descriptions de comportements ou de maladies dans le but d'extraire la structure sémantique.

Objectif 2: mettre ces représentations au défi de fournir des explications aux relations observées, dans deux cadres distincts: i) une analyse statistique des associations obtenues ii) l'intégration des ces informations dans un langage spécifique aux neurosciences.

Objectif 3 : diffuser des résultats facilement utilisables (atlas du cerveau, ontologies, logiciels) et contribuer à des outils de partage de données en ligne pour la neuroimagerie.

Coordination du projet

Bertrand THIRION (Centre de Recherche Inria Saclay - Île-de-France)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Inria Saclay - Ile-de-France - équipe PARIETAL Centre de Recherche Inria Saclay - Île-de-France

Aide de l'ANR 534 600 euros
Début et durée du projet scientifique : février 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter