Régression par Transport Optimal en Informatique Graphique et Vision par Ordinateur – ROOT
ROOT développera des méthodes numériques de résolution de problèmes importants rencontrés en informatique graphique et vision par
ordinateur via la théorie du transport optimal de masse. Ces problèmes concernent les histogrammes et peuvent être avantagement
écrits et résolus par des regressions dont la fonction objectif fait appel au transport optimal. Des problèmes types incluent l'ajustement
au données, l'apprentissage supervisé ou encore l'inférence statistique.
On rencontre des histogrammes très fréquemment en informatique graphique (e.g., les fonctions de reflectance, les palettes
de couleurs ou les histogrammes de distances etc.) ainsi qu'en vision (e.g., les descripteurs SIFT ou HoG). Mais souvent, ces histogrammes sont traités comme de simples vecteurs Euclidiens afin de beneficier des nombreux outils existants en machine learning, ou d'autres métriques peu adaptées sont utilisées pour les comparer et les manipuler. En même temps, la théorie du transport optimal à la popularité croissante considère les histogrammes comme des tas de sable que l'on peut déplacer avec un certain effort. A partir de ce principe, le transport optimal offre un cadre pour comparer les histogrammes de manière pertinente comme étant le travail total à fournir pour déplacer un premier tas de sable vers un autre. Il permet aussi d'obtenir une interpolation entre différent histogrammes, en considérant les états intermédiaires de ces tas de sable en mouvement.
Le projet ROOT explore l'utilisation du transport optimal, mais comme métrique dans un contexte de problèmes inverses en graphique et vision, et de machine learning. Par ailleurs, cette théorie reste couteuse en pratique, et des solveurs numériques efficaces de transport optimal seront aussi étudiés.
Les challenges que ROOT attaquera incluent:
- Un calcul numérique efficace du transport optimal entre histogrammes. Puisque nos outils de regression feront des appels répétés à des solveurs de transport optimal lors des itérations d'optimisation, cette étape doit être rendue calculatoirement efficace. Nous investiguerons des méthodes basées sur les diagrammes de Voronoi / de puissance, par programmation linéaire et régularisation entropique via les projections de Bregman. Nous nous efforcerons d'offrir des outils traitant des données éparses en haute dimension, mais aussi des histogrammes plus simples, structurés en grilles de faible dimension, en considérant à la fois des approches Eulériennes mais aussi Lagrangiennes.
- La résolution de problèmes inverses importants en graphique et vision par transport optimal. Ces problèmes seront formulés comme des régréssions dans le cadre du transport optimal. Ils seront utilisés pour de l'inférence, de l'apprentissage supervisé et de l'ajustement aux données. Les applications types en informatique graphique incluent l'ajustement des données de reflectances à des modèles analytiques, l'inférence de valeurs manquantes pour des données capturées ou mesurées (reflectances, géométries 3D), et l'apprentissage d'espaces d'histogrammes de couleurs pour la manipulation de couleurs dans les photos et vidéos. Les applications types en vision par ordinateur incluudent l'inférence de paramètres de modèles de reflectance à partir d'images, et la reconnaissance d'objets à partir de base de données éparses.
ROOT offrira une librairie publique open-source efficace pour les problèmes de regression d'histogrammes.
Coordination du projet
Nicolas Bonneel (Laboratoire d'informatique en image et systèmes d'information)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
LIRIS - CNRS Laboratoire d'informatique en image et systèmes d'information
Aide de l'ANR 252 936 euros
Début et durée du projet scientifique :
septembre 2016
- 48 Mois