Méthodologies avancées pour la modélisation des systèmes interdépendants - applications en physique expérimentale – METAMODEL
"L'objectif de ce projet de recherche est de développer les outils mathématiques - et algorithmiques qui nous permettront d'étudier, de modéliser et d'entraîner des - systèmes de sous-systèmes interdépendants. Le projet de recherche est motivé par - des questions soulevées par des méthodes d'analyse de données en physique - expérimentale. Nous proposons de soutenir ces expériences en leur fournissant - des techniques d'analyse statistique, et, parallèlement, de développer des - méthodes générales en apprentissage statistique qui sont applicables dans des - domaines dont les caractéristiques sont similaires (en particulier, forage de - texte, bioinformatique et robotique). - - Le projet représentera une partie importante de l'activité de recherche du - nouveau groupe AppStat (Apprentissage Automatique et Statistique Appliqué) au - Laboratoire de l'Accélérateur Linéaire (LAL), dirigé par le responsable du - projet. Nous estimons également que la nature interdisciplinaire du projet - catalysera des collaborations fructueuses entre la communauté de l'apprentissage - statistique et les communautés des sciences naturelles du campus de l'Université - Paris Sud. - - Dans le cadre du projet, nous avons identifié trois thèmes particuliers et trois - applications dans le domaine de la physique expérimentale des particules - élémentaires. Les applications profiteront directement des solutions aux - problèmes proposés, tandis que les sous-projets contribueront à la résolution - d'importants problèmes dans le domaine de l'apprentissage automatique. Les trois - thèmes sont regroupés autour des questions méthodologiques et calculatoires sur - la modélisation et l'entraînement d'un système formé de sous-systèmes - interdépendants. - - Objectifs (thèmes) - - A) Modélisation des systèmes de systèmes. Dans ce thème, nous développerons les - cadres mathématiques dans lesquels les systèmes de sous-systèmes interdépendants - peuvent être décrits et analysés. Nous proposerons deux approches. Dans la - première, nous associerons les sous-systèmes dans le cadre d'un modèle de - réseaux bayesien global, et nous utiliserons des outils probabilistes standards - pour entraîner le système. La deuxième approche est basée sur AdaBoost, un des - algorithmes d'apprentissage les plus aboutis de la dernière décennie. - - B) Optimisation des hyper-paramètres en utilisant des processus gaussiens. Dans - un système constitué de nombreux sous-systèmes, un des problèmes les plus - difficiles est l'optimisation simultanée des nombreux hyper-paramètres (les - paramètres qui déterminent la complexité de chaque sous-système). Le but de ce - thème est de développer des méthodes d'optimisation basées sur des travaux - récents d'un des membres du projet sur l'optimisation des fonctions chères à - évaluer. - - C) Implémentations sur la grille. Dans ce thème, nous proposons de paralléliser - les méthodes développés dans A) et B), et de les implanter sur la grille EGEE - (une grille de plusieurs 10K de CPU, mise en place partiellement pour satisfaire - les besoins en calcul (CPU) et de stockage du projet "Large Hadron Collider" - (LHC) au CERN). - - Applications - - 1) L'expérience Pierre Auger. Le but de cette expérience est d'étudier les - propriétés des rayons cosmiques d'ultra-haute énergie en observant les gerbes - atmosphériques générées. Pour cet objectif, un grand observatoire de 1600 cuves - et quatre détecteurs de fluorescence a été construit dans la Pampa - argentine. Les méthodologies développées en A) et B) fourniront un cadre global - pour formaliser les modèles statistiques et pour optimiser le processus - d'estimation; les outils développés en C) rendront la procédure - computationellement faisable. - - 2) L'expérience ATLAS. ATLAS est une des expériences installées sur - l'accélérateur LHC. Son objectif est d'explorer la nature fondamentale de la - matière et les forces basiques qui sculptent notre univers en observant le - produit des collisions proton-proton. Nous utiliserons le cadre de la - modélisation proposé...
Coordination du projet
Organisme de recherche
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Aide de l'ANR 149 946 euros
Début et durée du projet scientifique :
- 36 Mois