Modèles de Transport Optimal généralisés pour le traitement d'images – GOTMI
Notre société est en interaction constante avec les contenus visuels et les images. Les tendances du marché électronique indiquent que le nombre d’achat d’appareils d’acquisition mobile va augmenter considérablement dans les prochaines années. Un accroissement spectaculaire de la quantité d’utilisateurs est donc attendu. De nouveaux besoins et services émergent donc pour les industries, les professionnels de l’image et le grand public.
Afin d’utiliser au mieux le contenu visuel acquis, des méthodes de traitement d’image précises et efficaces sont nécessaires. Ceci implique un contrôle des statistiques globales des images afin de (i) améliorer leur qualité (ii) faciliter l’analyse de leur contenu (iii) améliorer les méthodes d’indexation d’images. Les statistiques des images peuvent être de différents types : colorimétrique, géométrique, teinte, texture… Des applications directes du contrôle de telles caractéristiques visuelles sont l’homogénéisation de couleur et de teinte d’ensembles d’images (images haute-résolution, séquence vidéo), retrait d’ombres ou de zones de surexposées, transfert d’attributs de style (textures), etc.
Un nombre important de problèmes majeurs de traitement d’images est aussi concerné. En effet, le développement de méthodes génériques permettant d’homogénéiser les statistiques de couples d’images ou de décrire des informations haut-niveau (forme, objet. etc.) nécessite des métriques rapides et robustes pour comparer ces statistiques. La segmentation ou la fouille d’images sont ainsi directement concernés.
Il n’y a actuellement aucune méthode automatique permettant d’égaliser globalement les statistiques de paires d’images dans des temps de calculs raisonnables. A moins de considérer d’importantes interactions avec un utilisateur, seules des égalisations approchées peuvent être réalisées.De plus, lorsque l’on considère des descriptions haut-niveau, des descripteurs hétérogènes (couleurs, textures, formes, etc.) et de grandes dimensions doivent être gérés. Alors qu’un effort de recherche conséquent est dédié à l’amélioration de ces descripteurs (en ajoutant de l’information textuelle ou sémantique) dans une perspective de traitement de mégadonnées, les métriques couramment utilisées ne permettent pas de gérer efficacement le bruit et les données aberrantes.
Bien que peu connu, le Transport Optimal est un outil puissant pour définir des métriques robustes aux données aberrantes. Contrairement à la plupart des distances de la théorie de l’information (divergence de Kullback-Leibler par exemple), le TO prend en compte la position spatiale des modes des densités. La littérature scientifique a ainsi montré que le TO permet d’obtenir des résultats de référence pour la comparaison de statistiques. La limitation majeure de cette approche est qu’elle implique des coûts de calculs rédhibitoires pour des applications pratiques.
Le TO a néanmoins été appliqué avec succès pour le transfert de couleur ou la fouille d’images. En utilisant des modèles simplifiés de transport, des implantations algorithmiques proches du temps réels ont en effet été obtenues. Afin d’améliorer les performances de ces approches et de les appliquer à un spectre plus large de problèmes, cette modélisation simplifiée n’est pas suffisante.
Le challenge scientifique est de proposer des distances de Transport Optimal généralisées menant à des temps de calculs quasi temps réels. Un déploiement à grande échelle du TO permettra un gain significatif dans l’amélioration des performances de nombreux problèmes de traitement de signaux et d’images.
Dans ce contexte, l’objectif du projet GOTMI est de généraliser, améliorer et adapter les concepts du Transport Optimal afin de développer de nouveaux outils méthodologiques et algorithmiques pour le traitement rapide d’images couleurs. Ces problèmes scientifiques et technologiques sont un travail de recherche amont pour une meilleure dissémination et exploitation de données massives d'images.
Coordination du projet
Nicolas Papadakis (Institut de Mathématiques de Bordeaux)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
IMB Institut de Mathématiques de Bordeaux
Aide de l'ANR 165 348 euros
Début et durée du projet scientifique :
octobre 2016
- 48 Mois