CE23 - Intelligence artificielle et science des données 2023

Revisiter les fondements de l'équité algorithmique pour les graphes – REFAIR

Résumé de soumission

Depuis quelques années l'apprentissage profond domine le domaine de l'apprentissage automatique en raison de ses performances impressionnantes sur divers types de données, notamment les images, le texte ou les graphes, pour n'en nommer que quelques-uns. Pour ce dernier type de données, les Graphs Neural Networks (GNNs) se sont récemment imposés comme l'état de l'art pour les tâches en aval liées aux graphes. Ces modèles considèrent deux types d'entrées pour apprendre une bonne représentation : la structure du graphe (généralement sous la forme d'une liste d'arêtes) et une matrice d'attributs de nœuds et/ou d'arêtes. Les GNNs sont capables de tirer parti des deux types d'informations pour apprendre des représentations puissantes et modélise le principe d'homophilie : les nœuds similaires (de part leurs attributs) sont plus susceptibles d'être connectés les uns aux autres que des nœuds différents. Bien que cette hypothèse soit valable dans de nombreux scénarios du monde réel , l'homophilie a été identifiée comme une source potentielle de ségrégation dans les réseaux sociaux, et mettre l"accent sur l'homophilie dans un graphe entraîne directement l'accentuation des biais. Dans ce projet, nous visons à adopter une approche interdisciplinaire pour relier les travaux existants en sociologie avec des concepts de l'apprentissage automatique, et plus précisément de l'apprentissage des représentations, pour mieux formaliser et comprendre les mécanismes responsables des biais dans les graphes. Un objectif ultérieur de REPAIR est de dériver des algorithmes théoriquement fondés pour apprendre une représentation pour les graphes équitable pour diverses tâches en aval, notamment la classification des nœuds et la prédiction de liens. Enfin, nous étendrons notre analyse pour étudier les concepts d'équité sur des graphes évoluant dans le temps correspondant au déploiement dans le monde réel de modèles d'apprentissage automatique dans des applications industrielles.

CHARLOTTE LACLAU (Laboratoire Traitement et Communication de l'Information)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

LTCI Laboratoire Traitement et Communication de l'Information

Aide de l'ANR 163 440 euros
Début et durée du projet scientifique : février 2024 - 42 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.