CE40 - Mathématiques

Géométrie dans les données : inférence statistique & partitionnement – GeoDSIC

Résumé de soumission

La science des données fait intervenir plusieurs branches des mathématiques, dont la statistique et la géométrie. Ce projet est consacré à l'inférence géométrique et topologique, qui soulève d’importants défis mathématiques. Il s'agit de découvrir certaines caractéristiques d'une forme inconnue à partir d’observations. Souvent, les données consistent en un nuage de points échantillonné sur la forme, éventuellement avec un bruit. Plus généralement, en observant d variables sur n individus, on cherche une relation non linéaire entre variables, qui peut être contenue dans une forme de dimension plus petite. Nous étudierons des questions allant de la quantification et la classification non supervisée à l'estimation d'une forme. La robustesse au bruit constitue un point clé dans les approches envisagées. Nous nous attacherons à développer des méthodes adaptatives et des procédures calculables avec garanties théoriques.
Notre projet s'articule autour de 5 thèmes.
Le premier thème rassemble plusieurs problèmes en estimation de variétés. Un intérêt particulier est porté aux données bruitées, et à l’estimation du reach, paramètre de régularité d’une variété. Nous considérons également le cas d’une dynamique temporelle.
Un second thème se rapporte aux courbes et surfaces principales contraintes, en estimation et en apprentissage statistique, incluant l’aspect algorithmique.
Ensuite, le thème de la quantification et du clustering comprend l’étude de ces méthodes sur des graphes quantiques et l’exploration d’une stratégie d’agrégation de partitions basée sur le clustering spectral.
Un autre thème concerne des questions faisant intervenir la distance de Wasserstein, en déconvolution, mais aussi dans le contexte de l’estimation au moyen de réseaux antagonistes génératifs.
Enfin, le dernier thème, dédié à l’analyse topologique des données, porte sur la construction d’un test statistique non paramétrique, ainsi que sur des perspectives d’implémentation logicielle.

Coordination du projet

Aurélie Fischer (Sorbonne Université)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

LMJL Ecole Centrale de Nantes
LPSM Sorbonne Université

Aide de l'ANR 316 607 euros
Début et durée du projet scientifique : December 2022 - 60 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter