Tests Statistiques efficaces pour les données de grande dimension: application à l'imagerie cérébrale et la génétique – FAST-BIG
Dans beaucoup de domaines des sciences, les capteurs utilisés dans les dispositifs de mesure s'améliorent, ce qui conduit à une augmentation de la résolution des phénomènes observés, et donc à des jeux de données de plus en plus volumineux. Alors que la dimension des mesures augmente, le nombre d'observations indépendantes est souvent limité pour des raisons physiques ou financières. Ceci conduit à des jeux de données complexes, mais observés par petits échantillons.
Une question qui se pose est donc d'identifier les caractéristiques des données informatives pour expliquer une variable cible. Cela revient à inférer les relations entre ces variables et la cible, conditionnellement aux autres variables. De nombreuses branches de la science des données, dans lesquelles on veut tester et comparer des modèles, requièrent des garanties statistiques sur ces associations, qui restent très délicates à obtenir.
FAST-BIG vise à développer les outils théoriques et des procédures d'estimation pratiques pour rendre l'inférence statistique possible dans ces cas difficiles. Nous développerons les outils logiciels correspondants et évaluerons les tests proposés dans deux applications: la génomique et l'imagerie cérébrale.
Coordinateur du projet
Monsieur Bertrand THIRION (Institut National de Recherche en Informatique et en Automatique)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
UPSud + LMO Université Paris Sud + Laboratoire de mathématiques d'Orsay
LBBE - CNRS Biométrie et biologie évolutive
Inria Saclay - Ile-de-France - équipe PARIETAL Institut National de Recherche en Informatique et en Automatique
Aide de l'ANR 442 072 euros
Début et durée du projet scientifique :
février 2018
- 48 Mois