CE31 - Physique subatomique et astrophysique

Convolution optimale de graphes pour l'identification efficace de particules – OGCID

Résumé de soumission

La plupart des découvertes récentes en physique des particules sont dues à l'augmentation du volume et / ou de la granularité des détecteurs, permettant d'observer des phénomènes complexes, jusque là inaccessible par manque de précision. Cette approche augmente les statistiques disponibles et la précision par plusieurs ordres de grandeurs, ce qui facilite la détection des évènements rares. Le problème, c'est que la plupart des techniques standards pour la reconstruction et le déclenchement sont inopérantes dans ce contexte. Par exemple, les déclenchements basés sur une coupure en énergie, ne permettent pas de gérer la complexité des collisions avec un fort niveau d'empilement. Les méthodes à base de réseaux de neurones artificiels sont bien connus pour gérer facilement des données complexes et bruitées dans les domaines de la classification de haut niveau et la régression. En particulier, les techniques de convolution ont permis des progrès spectaculaires dans le domaine de la vision par ordinateur. Malheureusement, elles sont inadaptées telle quelle pour les topologies particulières des détecteurs et leur distribution irrégulière de senseurs. Des alternatives, comme la convolution spatiale de graphes, permet d'appliquer des noyaux de convolutions aux données représentées sous la forme d'un graphe non orienté portant les mesures effectuées sur les senseurs. Ces techniques ont prouvé leur efficacité sur les données du LHC mais aussi sur des expériences de détection de neutrinos. Elles permettent de faire de l'identification de particule, comme de la régression de paramètres continus, mais aussi de la segmentation de données intriquées, fondamentale dans l'identification des particules secondaires.
Les opérations qui transforment les données en graphes ont souvent un cout computationnel très important. En particulier, toutes les techniques basées sur des paramètres appris (au sens du machine learning) ne permettent pas à ce type de techniques d'être utilisées dans les contextes où le temps de calcul et la latence sont contraints. Par exemple, dans l'expérience Super-Kamiokande, un tel système remplacerait avantageusement le système actuel basé sur une coupure en énergie, qui rejette de nombreux évènements malgré leur intéret physique. Un autre exemple est le future calorimètre frontal à haute granularité (HGCal) de CMS pour lequel il devient crucial de pouvoir extraite des primitives de déclenchement de haut niveau directement dans l'électronique pour gérer la complexité induite par la haute luminosité. C'est pourquoi, il est du plus haut intéret de mettre au point des versions à haute performance de ces algorithmes, qui permettront d'être implémentées dans tous les cas contraints en temps de calcul.
L'objectif de ce projet est de développer de d'implémenter un nouvel algorithme efficace de sélection pour les environnements à puissance de calcul restreinte, en se basant sur trois idées principales
• Réduire la complexité de la construction de graphe en développant des algorithmes basés sur une connectivité pré-calculées des graphes ce qui devrait permettre d'obtenir une complexité presque linéaire pour la partie construction. Cela est rendu possible par le fait que les senseurs d'un détecteur de particules occupent des positions fixes dans l'espace.
• Developper une version segmentée de la convolution de graphe, permettant de la distribuer sur de multiples unités computationnelles.
• Optimiser la taille et la nature des réseaux de convolutions avec des techniques d'optimisation d'ordre zéro (sans dérivée), et l'adapter aux implémentations dans l'électronique.

Ces objectifs seront déclinés dans trois contextes expérimentaux : reconstruction offline de HGCal, déclenchement de niveau 1 de HGCal et reconstruction du fond diffus de neutrinos de supernovae (DSNB) dans l'expérience Super-Kamiokande.

Coordination du projet

Frédéric Magniette (Laboratoire Leprince-Ringuet)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LLR Laboratoire Leprince-Ringuet

Aide de l'ANR 215 337 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter