Détection profonde d'anomalies en ligne – ODD
La détection d’anomalies est un défi en soi. Elle est non supervisée par nature, car les événements anormaux sont rares, variés et difficiles à collecter. En tirant parti des réseaux de neurones profonds pour l'apprentissage de représentation, les principales catégories de méthodes de détection d'anomalies sont les classifieurs mono-classe profonds, les autoencodeurs, les réseaux adversariaux génératifs, ainsi que les méthodes d’apprentissage auto-supervisé. Le défi est encore plus ambitieux en détection d’anomalies dans un flux de données. En effet, les séries temporelles sont susceptibles de présenter des spécificités, notamment une saisonnalité, une non-stationnarité, ou encore une dérive conceptuelle. De plus, les anomalies dépendent fortement de la contextualisation temporelle et la détection précoce doit être effectuée en temps réel.
L’objectif du présent projet est de résoudre les principaux obstacles rencontrés en détection profonde d'anomalies dans un flux de données. Deux problèmes de détection en ligne se posent selon que l'anomalie soit à court terme ou durable : détection d'anomalies ponctuelles ou détection de point de rupture. Dans cette optique, trois directions de recherche sont explorées :
- Selon le paradigme de détection en ligne, nous attaquons les récentes avancées en matière de détection d'anomalies en proposant deux stratégies originales : d’une part, nous revisitons les représentations profondes pour la détection d’anomalies à la lumière des spécificités des séries temporelles ; d’autre part, nous explorons une approche adaptative ensembliste pour la détection d’anomalies dans des flux de données évolutifs.
- Nous explorons la théorie du transport optimal pour fournir des méthodes de traitement en ligne pour la détection d’anomalies et pour la caractérisation du point de rupture et du glissement de la distribution dans le cas d’une dérive conceptuelle.
- Nous visons à tirer parti des fondements théoriques de la détection de points de rupture, afin de les mettre en œuvre dans un espace de représentation profonde, grâce aux progrès réalisés dans les modèles génératifs en apprentissage profond.
En complément des contributions essentiellement fondamentales en apprentissage statistique, le projet abordera plusieurs domaines applicatifs. En plus du traitement de séries temporelles issues de capteurs, nous nous intéressons aux séries temporelles multivariées complexes pour la surveillance des machines tournantes, à la détection de pollution environnementale dans les remontées de bio-capteurs, ainsi qu’à l’intégration du contexte spatial pour la détection d’anomalies dans les images.
Coordination du projet
Paul HONEINE (LABORATOIRE D'INFORMATIQUE, DE TRAITEMENT DE L'INFORMATION ET DES SYSTÈMES - EA 4108)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
LITIS LABORATOIRE D'INFORMATIQUE, DE TRAITEMENT DE L'INFORMATION ET DES SYSTÈMES - EA 4108
Aide de l'ANR 600 642 euros
Début et durée du projet scientifique :
janvier 2024
- 48 Mois