Inférence rapide et contrôle de l'incertitude: applications aux observations astrophysiques. – SHERLOCK
SHERLOCK est un projet équilibré entre un projet de recherche et un projet de formation au niveau Master de recherche. Son originalité tient à 3 motivations essentielles : un programme de recherche prometteur en IA avec des applications interdisciplinaires en astrophysique et en chimie, un programme ambitieux de formation à la recherche de haut niveau, et un fort couplage entre recherche et formation à la recherche par la recherche.
SHERLOCK-recherche : L’objectif principal de SHERLOCK est d’imaginer de nouvelles méthodes d’inférence bayésienne non seulement rapides mais qui permettent aussi de quantifier l’incertitude des prédictions, y-compris dans des situations où on ne dispose d’aucune vérité terrain. L’approche proposée que nous avons récemment initiée emprunte des idées aux méthodes de Monte-Carlo par chaînes de Markov (MCMC) et à l’optimisation, ainsi qu’à l’apprentissage statistique. D’un côté, la quantification des incertitudes implique l’exploration du voisinage de la solution proposée : c’est précisément ce que les méthodes MCMC font très bien. D’un autre côté, les méthodes MCMC souffrent de limitations lorsqu’il s’agit de travailler en grande dimension ou lorsqu’une vraisemblance coûteuse doit être évaluée un grand nombre de fois. Dans ce cas, les méthodes d’optimisation peuvent apporter une solution, qui reste un estimateur ponctuel le plus souvent. Ce projet vise à faire collaborer méthodes MCMC et optimisation grâce à des méthodes d’échantillonnage hybrides et à l’augmentation de variables (splitting) en particulier. Nous sommes convaincus qu’un compromis est possible et souhaitons explorer cette direction. Un autre problème essentiel est le passage à l’échelle qui est souvent abordé par une réduction de dimension préalable ou une compression des données. Dans cet objectif, nous allons étudier le potentiel des processus ponctuels déterminantaux (DPP). Nos contributions méthodologiques concerneront l’apprentissage statistique et les problèmes inverses en traitement du signal. Nous traiterons des applications en astrophysique sur des données issues du consortium Orion-B d’une part, et du consortium Ligo-Virgo sur les ondes gravitationnelles d’autre part. De façon plus prospective, nous considèrerons aussi des problèmes liés à la chimie de la catalyse en collaboration avec l’equipex Realcat.
SHERLOCK-formation : Le parcours « Décision & Analyse de Données » qui devient « Science des données & intelligence artificielle » est sous ma responsabilité depuis que je l’ai créé en 2012. Ce programme de niveau M2 favorise l’ouverture vers la recherche. De façon remarquable, environ 20% des 24 diplômés poursuivent en thèse chaque année : ces profils sont très demandés (derniers recrutements à New-York University, Mc Gill/FAIR Montreal). En 2019, je serai responsable du nouveau Master Data Science commun à l’Université de Lille (et donc Polytech’Lille), Centrale Lille et l’IMT Lille-Douai. Je porte ce projet depuis 2 ans maintenant. Il a vocation à faire partie de la Graduate School de Lille. SHERLOCK apporterait un soutien inestimable à ces formations qui concernent 72 étudiants chaque année en permettant d’inviter des professeurs étrangers et en permettant de donner des bourses de mobilités entrantes pour d’excellents étudiants étrangers ainsi que des bourses de mobilités sortantes pour nos étudiants partant en stages à l’étranger.
Coordination du projet
Pierre CHAINAS (Centre de Recherche en Informatique, Signal et Automatique de Lille)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
CRIStAL Centre de Recherche en Informatique, Signal et Automatique de Lille
Aide de l'ANR 515 160 euros
Début et durée du projet scientifique :
février 2021
- 48 Mois