DS0708 - Données massives, connaissances, décision, calcul haute performance et simulation numérique 2014

Méthodes d'apprentissage pour les très grands réseaux d'antennes en radioastronomie – MAGELLAN

Résumé de soumission

Les découvertes fondamentales qui seront à la portée des grands interféromètres du futur (comme le SKA, Square Kilometer Array, vers 2025) expliquent l'effort international dédié ces dernières années à leur étude et à leur construction. Les performances de ces instruments reposent cependant sur une complexité de modèles et de traitements nouvelle et gigantesque. De plus, la puissance de calcul disponible en 2025 sera insuffisante pour le traitement de données comme celles de SKA. Enfin, la précision des algorithmes actuels de restauration des données est également en deçà de la sensibilité à laquelle ces instruments donneront accès.

La spécificité de MAGELLAN est de proposer des contributions méthodologiques visant à faire sauter ces trois verrous : complexité de la calibration, taille des données, précision des méthodes de restauration. Globalement, MAGELLAN se situe dans le contexte des problèmes inverses linéaires de très grande dimension. Sa spécificité est de sous-tendre un ensemble de techniques d’apprentissage derrière les divers aspects que l’inversion nécessite de contrôler: calibration du modèle direct, incertitude sur le modèle calibré, prise en compte des variations temporelles, spatiales et spectrales du modèle direct, construction d’information a priori menant à la meilleure restauration spatio-spectrale. Ces objectifs méthodologiques sont tous appréhendés dans la perspective d’un passage à l'échelle pour la résolution du problème inverse global.

MAGELLAN est également un projet ancré dans un contexte scientifique très concret, celui des futurs interféromètres radio. Les problématiques suivantes en constituent des difficultés de fond, clairement identifiées comme les pivots technologiques de leur succès. Premièrement, la variabilité spatiale et temporelle de la ionosphère impacte la précision de notre connaissance du modèle direct, qui devient le principal facteur limitant la précision de ces instruments. Deuxièmement, même dans le cadre d'un modèle direct 2D parfaitement connu, la complexité et la variété des morphologies des sources astrophysiques défient la précision et la généralité de l'information a priori injectée dans des approches de restauration régularisées ou pénalisées, dont les performances restent en deçà de la sensibilité cible de 60 dB que permet en théorie la surface collectrice d'un instrument comme SKA. Enfin, l'explosion de la taille du problème d’inversion est directement liée à la prise en compte de la dimension spectrale : SKA produira des dizaines de cubes hyperspectraux d’environ 80 TB chacun; de telles dimensions disqualifient les méthodes d'inversion globales passant par la minimisation de critères pénalisés.

Dans ce contexte, l’objectif de MAGELLAN est double. Il comporte d’une part une recherche méthodologique sur le passage à l’échelle dans les problèmes inverses, avec deux spécificités additionnelles. La première est la prise en compte d'erreurs dans le modèle direct; la deuxième est une forte contrainte imposée sur la précision de l’algorithme de restauration. En rupture avec l’approche classique suivie en radio-interférométrie, qui repose essentiellement sur une description a priori des éléments du modèle physique direct, MAGELLAN est ancré dans le domaine de l’apprentissage statistique et fait ainsi le choix de guider en partie les traitements par les données elles-mêmes. Le second objectif est l'implémentation de ces algorithmes dans le cas de la restauration de cubes hyperspectraux à partir des données des très grands radio-interféromètres, avec des stratégies de calcul parallèle ou distribué. La pertinence de ce type d’approches en radioastronomie a déjà été établie par certains acteurs de MAGELLAN dans le cadre de projets exploratoires concernant la reconstruction basée sur une sélection des observables, ou sur des a priori guidés par les données. MAGELLAN propose de généraliser ce type d’approches en apprentissage à l’ensemble du processus d’inversion.

André Ferrari (Laboratoire JL Lagrange (OCA/CNRS/UNS))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

LTCI CNRS-Telecom ParisTech Laboratoire Traitement et Communication de l'Information
SATIE Laboratoire des Systèmes et Applications des Technologies de l'Information et de l'Energie
LAGRANGE (OCA/CNRS/UNS) Laboratoire JL Lagrange (OCA/CNRS/UNS)
SATIE Laboratoire des Systèmes et Applications des Technologies de l'Information et de l'Energie

Aide de l'ANR 387 766 euros
Début et durée du projet scientifique : septembre 2014 - 36 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.