Données, géométrie et courbure – DataGC
Les données Riemanniennes sont omniprésentes en statistique et en apprentissage : complétion de matrices de faible rang, apprentissage de dictionnaires, factorisation de matrices, vision par ordinateur, apprentissage de formes, transport optimal, etc. Par surcroit, les données accessibles sont de plus en plus riches, et donc complexes et hétérogènes, c'est pourquoi il devient urgent de développer des méthodes permettant d'en extraire de l'information précise, robuste, efficace, tout en comprenant et en respectant leur géométrie.
DataGC permettra d'étudier et de développer des liens entre science des données, probabilités, notions de courbure, géométrie, afin de produire une théorie non asymptotique et non paramétrique de l'estimation de position sur les variétés riemanniennes. Nous concentrerons nos efforts sur les barycentres, les régions centrales et les supports de distributions, qui sont essentiels pour la visualisation de données ainsi qu'en statistique descriptive et inférentielle.
Coordination du projet
Victor Emmanuel Brunel (Groupe des Ecoles Nationales d'Economie et de Statistique)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
GENES Groupe des Ecoles Nationales d'Economie et de Statistique
Aide de l'ANR 112 435 euros
Début et durée du projet scientifique :
March 2022
- 24 Mois