CE23 - Intelligence artificielle et science des données 2024

Introspection de modèles GNN via l’apprentissage et l’exploitation de règles – PANDORA

Résumé de soumission

Parmi les réseaux de neurones profonds, les réseaux de neurones de graphes (GNN) sont très performants. Les graphes sont une structure de données très répandue et appropriée à la description de nombreux phénomènes du monde réel. Les GNN possèdent de nombreux paramètres qui interagissent de manière complexe pour apprendre des concepts sophistiqués et il est difficile de comprendre ce qu’un GNN a exactement appris. De plus, la pratique actuelle d’apprentissage des réseaux de neurones profonds par optimisation directe des paramètres pour maximiser les performances conduit à des solutions ne se généralisant pas aux scénarios du monde réel. En raison du manque d’explicabilité, on ne sait pas si un réseau a appris de vrais concepts ou s’il a exploité une coïncidence. Notre hypothèse est qu’un GNN est performant lorsqu’il a été capable d’apprendre des concepts importants des données. Ces concepts méritent d’être présentés aux experts pour apprendre de nouvelles connaissances scientifiques ou pour détecter des biais dans les données d’entraînement. Le principe des solutions que nous réaliserons dans PANDORA est de fournir ces connaissances en introspectant les modèles GNN. Nous proposons de caractériser et d’expliquer en termes facilement compréhensibles le fonctionnement interne des GNN à l’aide de techniques de fouille de motifs. L’idée est de découvrir des motifs statistiquement significatifs de coactivation neuronale afin de déterminer comment les réseaux encodent les concepts sur plusieurs neurones, d’identifier les informations partagées entre les couches, de retracer les informations à travers le réseau et de déterminer comment le réseau perçoit le monde. Grâce aux motifs extraits, nous caractériserons les conditions dans lesquelles une prédiction du réseau est fiable afin d’apprendre des réseaux neuronaux profonds fiables et explicables. La généricité de nos méthodes sera illustrée par plusieurs cas d’étude (chémoinformatique, web social et web sémantique).

Peggy Cellier (Institut de Recherche en Informatique et Systèmes Aléatoires)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

IRISA Institut de Recherche en Informatique et Systèmes Aléatoires
ECOLE POUR L'INFORMATIQUE ET LES TECHNIQUES AVANCEES (EPITA)
GREYC Université de Caen Normandie

Aide de l'ANR 538 128 euros
Début et durée du projet scientifique : décembre 2024 - 48 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.