CE23 - Données, Connaissances, Big data, Contenus multimédias, Intelligence Artificielle

Apprivoiser la Pré-image – APi

Résumé de soumission

L'essor des méthodes d'apprentissage est certainement dû aux méthodes à noyaux et à la résurgence des réseaux de neurones dits profonds. Leur clé de voûte est le pré-traitement des données avec une transformation non linéaire qui les plonge dans un espace de redescription où les techniques de traitement de données peuvent être facilement appliquées. A part dans les modèles non linéaires qui surpassent les modèles linéaires pour les tâches de classification, cette projection non linéaire demeure inévitable dans de nombreux domaines. C'est le cas des données qui vivent dans un espace structuré, tel qu'en chimio-informatique et en bioinformatique, où les molécules sont représentées par des graphes, ou encore en traitement du signal avec des séries temporelles à échantillonnage irrégulier. La métrique euclidienne étant inappropriée dans ces contextes, les données doivent être projetées dans un espace approprié.

En apprentissage non supervisé, notamment en reconnaissance des formes et fouille de données, il est souvent nécessaire de revenir à l'espace initial afin d'interpréter le résultat. En effet, il faut souvent extraire le résultat dans l'espace des données, et non dans celui de redescription, comme par exemple pour l'estimation du barycentre d'un ensemble de graphes. La recherche de la transformation inverse, de l'espace de redescription à l'espace initial, est dite problème de pré-image. Ce problème d'optimisation est difficile et mal posé, dû à la transformation non linéaire, souvent implicite. De plus, il est plus difficile de considérer le problème d'optimisation sur des espaces structurés, comme dans tous les domaines susmentionnés (séries temporelles, graphes, ou encore chaînes de caractères).

Le présent projet vise à libérer le potentiel des méthodes d'apprentissage pour des problèmes non supervisées, en abordant la pré-image sous tous ses angles dans les méthodes à noyaux et les réseaux profonds, selon les points d'attaque suivants :
- Créer une nouvelle classe d'algorithmes qui surmontent la malédiction de la pré-image, en proposant un changement de paradigme grâce à des solutions explicites obtenues en utilisant des modèles probabilistes ou des stratégies d'optimisation conjointe.
- Mettre en place des méthodes d'apprentissage de métrique et de représentation pour des séries temporelles, en examinant, à la lumière de la pré-image, les réseaux neuronaux récurrents et hiérarchiques, les méthodes à noyaux temporels et les réseaux siamois.
- Explorer la reconnaissance de formes sur des espaces structurés discrets, notamment pour des graphes de données, en mettant l'accent sur la synthèse de graphes/molécules à partir d'un ensemble de graphes/molécules.
- Associer le problème de pré-image dans les méthodes à noyaux avec deux classes de réseaux de neurones, les autoencodeurs et les réseaux antagonistes génératifs, afin de fournir des analyses de leur fonctionnement sous-jacent et stimuler le développement et l'échange d'idées pour concevoir de nouvelles architectures.

A ces contributions théoriques dans le domaine d'apprentissage, s'ajoutent des contributions applicatives concernant plusieurs communautés scientifiques, dont le traitement du signal et des images, la bioinformatique et la chimio-informatique. De plus, comme le problème de la pré-image est omniprésent, ce projet vise également à élargir le champ d'application à de nouveaux domaines, notamment la fusion de données multimodales/hétérogènes.

Chacun de ces axes de travail étudiera simultanément les méthodes à noyaux et l'apprentissage profond. En permettant une fertilisation croisée des idées, ce projet cherche à combler le fossé entre ces classes d'algorithmes. Afin de répondre à tous ces défis, il vise à créer une synergie entre des équipes de recherche de renom. Il convient de souligner que des études préliminaires réalisées séparément par les membres du consortium ont montré la faisabilité, la pertinence et l'importance de ces orientations de travail.

Coordination du projet

Paul HONEINE (LABORATOIRE D'INFORMATIQUE, DE TRAITEMENT DE L'INFORMATION ET DES SYSTÈMES - EA 4108)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LTCI Laboratoire Traitement et Communication de l'Information
LITIS LABORATOIRE D'INFORMATIQUE, DE TRAITEMENT DE L'INFORMATION ET DES SYSTÈMES - EA 4108
LIG Laboratoire d'Informatique de Grenoble

Aide de l'ANR 527 443 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter