CE23 - Intelligence Artificielle

Adaptation au domaine online dans des environnements changeants – ODACE

Résumé de soumission

Au cours de la dernière décennie, les réseaux neuronaux profonds sont devenus l'état de l'art dans de nombreuses tâches de vision par ordinateur. Néanmoins, leurs performances sont affectées lorsque les données de test sont acquises dans des environnements visuellement différents des données utilisées lors de l'entrainement. Les récentes techniques d'adaptation au domaine sont efficaces pour atténuer ce problème, mais elles supposent que les distributions de données cibles sont fixes et disponibles par lot dans un mode hors-ligne. Ces limitations limitent fortement les applications potentielles. Dans ODACE, nous considérons le scénario d'un dispositif autonome, tel qu'une voiture ou un robot, naviguant dans un environnement en constante évolution. Dans ce scénario, les différentes tâches de vision sont effectuées à l'aide d'un réseau neuronal profond. Nous nous concentrons plus particulièrement sur des tâches de prédiction structurées telles que l'estimation de la profondeur et la segmentation d'instances. Dans ce projet, nous proposons de développer de nouveaux types d'algorithmes d'apprentissage profond où les paramètres du réseau sont continuellement adaptés pour gérer l'environnement visuel actuel. L'objectif est de concevoir des mécanismes dynamiques qui peuvent adapter de manière online les représentations du réseau sans supervision humaine en utilisant uniquement les images de l'environnement actuel.

Dans ce scénario, nous identifions quatre défis principaux. Premièrement, en raison de la nature séquentielle des données, le modèle ne dispose que de quelques échantillons de l'environnement actuel avec une variabilité visuelle limitée. Cette connaissance partielle de l'environnement affecte la performance des méthodes classiques d'adaptation. Ce problème est appelé adaptation partielle au domaine. Deuxièmement, dans ODACE, nous aborderons spécifiquement les problèmes de prédiction structurée. Dans ce cas, l'adaptation doit être contrainte de telle sorte qu'elle conduise à des prévisions avec des structures cohérentes. Troisièmement, dans le cas des réseaux neuronaux profonds, les paramètres sont mis à jour grâce à l'algorithme de la descente de gradient stochastique (SGD). Dans le cas d'un séquence vidéo, la SGD est problématique car elle est coûteuse en termes de calcul et elle suppose que les échantillons d'entraînement sont indépendants et identiquement distribués alors que les frames d'une vidéo sont généralement corrélées. Par conséquent, de nouvelles méthodes d'optimisation doivent être conçues pour obtenir une adaptation online rapide. En quatrième lieu, nous supposons que le dispositif autonome peut rencontrer des environnements similaires à ceux vus précédemment. Par conséquent, nous proposons de développer des modèles capables de tirer parti des expériences d'adaptation passées afin de s'adapter plus rapidement à l'environnement actuel. Cette capacité à apprendre continuellement en conservant les expériences acquises précédemment est appelée apprentissage continu. Les réseaux neuronaux ont tendance à oublier les informations précédemment apprises. Des solutions ont été proposées pour pallier ce problème d'oubli catastrophique, mais elles se limitent généralement à des problèmes de classification. Par conséquent, nous visons à concevoir de nouvelles méthodes d'apprentissage continu pour les tâches de prédiction structurées qui peuvent s'adapter au contexte de manière online.

Pour illustrer le large éventail d'applications potentielles de nos approches, les méthodes proposées seront évaluées sur quatre cas d'utilisation différents correspondant à deux tâches (estimation de la profondeur et segmentation d'instances) implémentées dans deux scénarios différents (voiture autonome et navigation robotisée). Afin de valider les méthodes développées dans ce projet, nous prévoyons d'enregistrer une nouvelle base de données pour l'estimation de la profondeur dans le cas d'un environnement en constante évolution.

Coordination du projet

Stéphane Lathuilière (Laboratoire Traitement et Communication de l'Information)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LTCI Laboratoire Traitement et Communication de l'Information

Aide de l'ANR 277 001 euros
Début et durée du projet scientifique : novembre 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter