ASTRID - Accompagnement spécifique des travaux de recherches et d’innovation défense

Détection et reconnaissance d’objets multiples sur fond variables par apprentissage profond – DEEPDETECT

Résumé de soumission

L’apprentissage profond (ou deep learning) est une technique en fort développement ces dernières années car elle a démontré qu’elle pouvait conduire à des performances excellentes quand il s'agit de faire réaliser une tâche spécifique à un ordinateur (pour classer automatiquement des images, détecter et reconnaître des objets dans des images, reconnaître la parole d'un locuteur, etc.). Nous proposons donc dans ce projet de nous appuyer sur cette technique, et plus particulièrement sur les réseaux de neurones convolutionnels (CNN), pour résoudre les tâches de détection/reconnaissance d’objets de petite taille dans des images. Les deux applications qui seront considérées sont la détection et la cartographie des populations de mammifères marins par imagerie satellitaire et la détection et reconnaissance d’objets (véhicules) dans des images infrarouges.
Pour ces deux applications, nous sommes en présence d’objets de petites tailles, typiquement 5x5 à 10x10 pixels dans des images. Pour répondre à la problématique de détection et de reconnaissance nous proposons de mettre en œuvre deux approches différentes. La méthode la plus directe consiste à utiliser une étape dite de « fenêtre glissante » permettant d’extraire des imagettes que l’on peut ensuite entrer successivement dans une architecture de type CNN permettant de faire de la classification. La seconde approche consiste à traiter toute l’image en une seule fois en s’appuyant cette fois-ci sur une méthode de segmentation sémantique. On obtient alors une carte de segmentation où chaque pixel porte une information sémantique sur la classe (objet) à laquelle il appartient a priori. Ces deux méthodes seront développées par l’ensemble des membres du consortium via une base de données synthétique mise à disposition par le partenaire industriel. Ces architectures devront aussi être définies avec l’idée de répondre aux futures contraintes de portabilité rencontrées dans un cadre opérationnel.
D’autre part, nous allons nous intéresser à la variabilité de la base de test par rapport à la base d’apprentissage. Pour cela nous allons considérer l’apparition de nouvelles variétés de fonds dans les images de test, avec objets connus. En effet, la base de test utilisée lors de l’apprentissage peut ne pas prendre en compte cette variabilité en opérationnel. De plus, nous évaluerons les pertes en performances liées au transfert des données synthétiques vers une base de test réelle. Des acquisitions effectuées par MBDA à l’aide d’un drone viendront alors compléter les données déjà disponibles. Par ailleurs, nous évaluerons aussi le transfert d’une base de données d’apprentissage avec des images de télédétection haute résolution vers des images basse résolution.
Nous proposons aussi d’étudier les performances en spécialisation de la méthode via des situations opérationnelles. Pour cela nous mettrons en œuvre des méthodes « simples » permettant l’apprentissage incrémental via l’architecture retenue.
L’ensemble de ces éléments feront l’objet d’évaluations en termes de performances. Les objectifs seront par exemple de monitorer l’évolution de l’apprentissage, de proposer des critères pour quantifier les performances en détection et reconnaissance.
Enfin, comme indiqué précédemment, dans ce projet nous proposons de prendre en compte dans la définition de notre architecture de deep learning les contraintes opérationnelles. Ainsi nous proposons une première analyse des problèmes et solutions relatifs à la portabilité en temps réel pour des systèmes embarqués. Nous aborderons à la fois les aspects matériels (carte graphiques, consommation d’énergie, etc.) et logiciels (solutions permettant d’alléger et d’accélérer les calculs).

Coordinateur du projet

Monsieur Alexandre BAUSSARD (Laboratoire des sciences techniques de l'information, de la communication et de la connaissance)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

AMURE AMÉNAGEMENT DES USAGES DES RESSOURCES ET DES ESPACES MARINS ET LITTORAUX
IRISA Institut de Recherche en Informatique et Systèmes Aléatoires
MBDA Systems MBDA FRANCE
Lab-STICC Laboratoire des sciences techniques de l'information, de la communication et de la connaissance

Aide de l'ANR 297 525 euros
Début et durée du projet scientifique : décembre 2017 - 30 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter