T-ERC_COG - Tremplin-ERC Consolidator Grant

Adaptation de domaine de la théorie à la pratique – MATTER

Résumé de soumission

L'adaptation de domaine (AD) est un problème fondamental en statistique, en apprentissage automatique et en science des données, qui consiste à estimer un modèle prédictif à partir de données d'apprentissage étiquetées en présence d'un changement dans les propriétés des données de test. Ce problème qui vise à compenser un "data shift" est très courant dans les applications pratiques et difficile à traiter en raison du manque de données supervisées dans les données de test. Malgré une communauté de recherche active, les méthodes DA restent rarement utilisées dans la pratique. L'objectif du projet MATTER est de s'attaquer aux goulots d'étranglement théoriques et pratiques qui empêchent l'utilisation plus large de l'AD dans les applications de ML.

MATTER se concentre sur la racine du problème de l'AD : l'estimation du décalage ou shift entre les domaines, qui sera réalisée à l'aide du transport optimal, de méthodes d'estimation de variétés et de modélisation physique. Cela conduira à des méthodes nouvelles et interprétables de classification et d'estimation du shift pour l'AD. Ces résultats seront utilisés pour mettre en œuvre des procédures de validation robustes qui font encore défaut dans la communauté DA et ouvriront la voie au premier cadre de DA automatique (AutoDA). MATTER se penchera également sur le problème général de l'AD où de multiples shifts sont présents entre plusieurs ensembles de données et proposera des méthodes interprétables et adaptatives (distribuées). MATTER étudiera enfin le problème de l'AD hétérogène qui peut se produire entre des ensembles de données hétérogènes ou multimodales entre plusieurs appareils de mesure et entre des données structurées telles que des graphes.

Les méthodes proposées seront validées à l'aide d'un nouveau benchmark open source sur plusieurs types de données (vision par ordinateur, biomédical, audio). Elles seront également évaluées sur une application biomédicale phare, la classification des stades du sommeil, où l'adaptation aux spécificités des sujets est nécessaire. L'un des principaux résultats du projet MATTER sera une boîte à outils open-source contenant les implémentations des méthodes DA, le benchmark et le tout premier logiciel AutoDA. En abordant à la fois les aspects théoriques et plus pragmatiques du domaine, le projet MATTER est une occasion unique de libérer le potentiel de l'AD .

Coordination du projet

Rémi Flamary (Centre de mathématiques appliquées)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

CMAP Centre de mathématiques appliquées

Aide de l'ANR 113 500 euros
Début et durée du projet scientifique : juin 2023 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter