Apprentissage non-supervisé de représentation pour la reconnaissance visuelle – UnLIR
Le projet se positionne dans les domaines de la vision par ordinateur et de l'apprentissage profond.
Nous nous intéressons ici à la classification d'image et à la recherche par l'exemple (image retrieval)
Les domaines de la vision par ordinateur et de l'apprentissage automatique ont connu un changement très important avec la repopularisation des réseaux de neurones profond (DNN).
Cependant ces méthodes on des limitations que nous souhaitons étudier:
1) les problèmes complexes tels que la classification à grain fin, pour lesquels des représentations intermédiaires discriminantes offrent de meilleures performances.
2) la nécessité d'utiliser des gros volumes de données annotées.
3) l'explicabilité des réseaux.
Ce projet vise à répondre à trois questions principales:
-Comment créer des réseaux capables de résoudre des tâches complexes ?
-Comment entraîner un réseau avec peu ou pas de données annotées ?
-Comment expliquer les décisions prises par un réseau ?
Plus précisément, nous souhaitons améliorer les capacités des DNN pour apprendre avec peu ou pas de données d’entraînement des représentations intermédiaires pour pouvoir résoudre des tâches complexes. Basé sur ces résultats, nous chercherons à interpréter les prises de décisions des CNN.
Coordination du projet
Ronan Sicre (LIS)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
LIS LIS
LINKMEDIA Creating and exploiting explicit links between multimedia fragments
Aide de l'ANR 264 135 euros
Début et durée du projet scientifique :
décembre 2019
- 48 Mois