CE23 - Données, Connaissances, Big data, Contenus multimédias, Intelligence Artificielle

Apprentissage Statistique pour les Séries Temporelles Environnementales – MATS

Apprentissage Statistique pour les Séries Temporelles Environnementales

Les récentes missions d'observation de la Terre ont tendance à viser des résolutions spatiales et temporelles de plus en plus fines.<br />Dans ce projet, nous nous concentrons sur l'utilisation de telles données pour trois problématiques environnementales particulièrement cruciales : l'impact des pratiques agricoles sur l'environnement, la préservation des forêts et le suivi de la qualité de l'air.

Résumé

Le projet MATS propose des approches novatrices dans le domaine de l'apprentissage dans les ensembles de séries temporelles, avec un intérêt tout particulier pour les méthodes permettant un passage à large échelle et qui peuvent opérer même lorsque la quantité d'annotations disponibles est relativement faible.<br />Plus précisément, le projet MATS vise à introduire de nouveaux paradigmes pour la classification de séries temporelles à large échelle, la modélisation spatio-temporelle et les approches faiblement supervisées pour les séries temporelles.<br />Les méthodes proposées couvriront un large spectre de problèmes d'apprentissage incluant l'adaptation de domaine, la classification non supervisée comme (semi-)supervisée, ou encore l'apprentissage de métrique pour lesquels une méthodologie dédiée fait défaut dans le domaine des séries temporelles.<br />Les méthodes développées dans le cadre du projet seront mises à la disposition de la communauté scientifique ainsi que des utilisateurs finaux à travers une boîte à outils open-source qui permettra la dissémination des apports proposés dans le cadre de MATS vers un grand nombre de contextes applicatifs.<br />De plus, les applications considérées dans le projet seront utilisées pour démontrer les bénéfices offerts par les méthodes développées dans le cadre de MATS en termes d'analyse de séries temporelles.

La tâche 1 traite de classification de séries temporelles à travers l’intégration de l’information de localisation (tâche 1.1) et le renforcement des liens entre modèles Shapelets et réseaux de neurones convolutionnels.
La tâche 2 concerne la modélisation de séries temporelles.
La tâche 3 a pour objet l’apprentissage faiblement supervisé, à travers des approches semi-supervisées (3.1), par apprentissage de métrique (3.2) et d’adaptation de domaine (3.3).
La tâche 4 est une tâche applicative et a donc vocation à reposer sur les développements des autres tâches.

[T1] L’intégration d’information temporelle a été abordée dans [1] pour des modèles de Random Shapelets. Sur les liens entre Shapelets et modèles convolutionnels, nous avons d’une part proposé une approche par apprentissage adversaire pour aider à l’interprétabilité des modèles de type Learned Shapelets [2] et, d’autre part, étudié la pertinence de l’utilisation d’approches hybrides (extraction et apprentissage de shapelets) à des fins d’accélération du processus d’apprentissage [3].
[T2] Dans ce cadre, nous avons développé un modèle de clustering de séries temporelles qui fonctionne en temps continu.
[T3] Les travaux sur les métriques se sont concentré sur l’alignement conjoint des axes temporels et des espaces de features. De plus, des travaux de membres du projet en transport optimal [6,7,8] serviront de base au développement de méthodes d’adaptation de domaine.
[T4] On peut noter les travaux de thèse d’Emilien Alvarez dans ce cadre, sur des questions de cartographie de l’habitat à l’aide de données de drones [9], ainsi que la collaboration avec Marc Russwurm, doctorant de la TU Munich, sur des questions de classification précoce de séries temporelles pour le suivi de l’agriculture [10].

Non pertinent à mi-projet.

[0] Romain Tavenard et al.. Tslearn, A Machine Learning Toolkit for Time Series Data. In Journal of Machine Learning Research, vol. 21, pp. 1 - 6, 2020.
[1] Maël Guillemé, Simon Malinowski, Romain Tavenard, Xavier Renard. Localized Random Shapelets. In Proceedings of the International Workshop on Advanced Analysis and Learning on Temporal Data, Wurzburg, Germany, 2019.
[2] Yichang Wang, Rémi Emonet, Elisa Fromont, Simon Malinowski, Romain Tavenard. Adversarial Regularization for Explainable-by-Design Time Series Classification. In Proceedings of ICTAI 2020, Greece, 2020.
[3] David Guijo-Rubio, Pedro Gutiérrez, Romain Tavenard, Anthony Bagnall. A Hybrid Approach to Time Series Classification with Shapelets. In Proceedings of the Intelligent Data Engineering and Automated Learning -- IDEAL, Manchester, United Kingdom, 2019.
[6] Titouan Vayer, Laetitia Chapel, Rémi Flamary, Romain Tavenard, Nicolas Courty. Optimal Transport for structured data with application on graphs. In Proceedings of the ICML 2019 - 36th International Conference on Machine Learning, Long Beach, United States, 2019.
[7] Titouan Vayer, Rémi Flamary, Romain Tavenard, Laetitia Chapel, Nicolas Courty. Sliced Gromov-Wasserstein. In Proceedings of the NeurIPS 2019 - Thirty-third Conference on Neural Information Processing Systems, Vancouver, Canada, 2019.
[8] Titouan Vayer, Laetitia Chapel, Rémi Flamary, Romain Tavenard, Nicolas Courty. Fused Gromov-Wasserstein Distance for Structured Objects. In Algorithms, vol. 13, no 9, p. 212, 2020.
[9] Emilien Alvarez-Vanhard, Thomas Houet, Cendrine Mony, Lucie Lecoq, Thomas Corpetti. Can UAVs fill the gap between in situ surveys and satellites for habitat mapping? Remote Sensing of Environment, Elsevier, 2020, 243.
[10] Marc Rußwurm, Romain Tavenard, Sébastien Lefèvre, Marco Körner. Early Classification for Agricultural Monitoring from Satellite Time Series. In Proceedings of the AI for Social Good Workshop at ICML, Long Beach, United States, 2019.

Les récentes missions d'observation de la Terre ont tendance à viser des résolutions spatiales et temporelles de plus en plus fines (voir par exemple la mission SENTINEL-2 de l'ESA).
Les données issues de ces missions peuvent alors être utilisées pour des analyses à un niveau de granularité particulièrement fin dans un grand nombre de domaines d'applications.
Dans ce projet, nous nous concentrons sur trois problématiques environnementales particulièrement cruciales : l'impact des pratiques agricoles sur l'environnement, la préservation des forêts et le suivi de la qualité de l'air.

Partant des spécificités de ces cas d'applications, le projet MATS propose des approches novatrices dans le domaine de l'apprentissage dans les ensembles de séries temporelles, avec un intértêt tout particulier pour les méthodes permettant un passage à large échelle et qui peuvent opérer même lorsque la quantité d'annotations disponibles est relativement faible.
Plus précisément, le projet MATS vise à introduire de nouveaux paradigmes pour la classification de séries temporelles à large échelle, la modélisation spatio-temporelle et les approches faiblement supervisées pour les séries temporelles.
Les méthodes proposées couvriront un large spectre de problèmes d'apprentissage incluant l'adaptation de domaine, la classification non supervisée comme (semi-)supervisée, ou encore l'apprentissage de métrique pour lesquels une méthodologie dédiée fait défaut dans le domaine des series temporelles.
Les méthodes développées dans le cadre du projet seront mises à la disposition de la communauté scientifique ainsi que des utilisateurs finaux à travers une boîte à outils open-source qui permettra la dissémination des apports proposés dans le cadre de MATS vers un grand nombre de contextes applicatifs.
De plus, les applications considérées dans le projet seront utilisées pour démontrer les bénéfices offerts par les méthodes développées dans le cadre de MATS en termes d'analyse de séries temporelles.

Coordination du projet

Romain Tavenard (LITTORAL, ENVIRONNEMENT, TELEDETECTION, GEOMATIQUE)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LETG LITTORAL, ENVIRONNEMENT, TELEDETECTION, GEOMATIQUE

Aide de l'ANR 214 920 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter