ASTRID - Accompagnement spécifique des travaux de recherches et d’innovation défense 2022

Politique de conception floue interprétable en apprentissage par renforcement – IFP-in-RL

Résumé de soumission

Dans le contexte général du domaine de l’eXplainable Artificial Intelligence (XAI), le projet IFP-in-RL a pour objectif la proposition d'une méthode de construction automatique d'un système de contrôle d'un système, tel qu'un drone, qui prenne en compte la contrainte d'interprétabilité dans sa conception même. Pour cela, ce projet se place dans le cadre des systèmes à base de règles floues qui, depuis leur introduction, ont pour but de faciliter l’expression de connaissances sous une forme linguistique, naturelle pour l’utilisateur, et facilement compréhensible par un humain. Une telle représentation des connaissances est un excellent moyen de favoriser l’interaction de l’humain avec le système informatique et d’améliorer sa compréhension de son fonctionnement, offrant ainsi la possibilité de rendre son comportement transparent et facilement validable. Dans la littérature, différentes approches de construction ou de mise au point d’une base de règles floues pour concevoir un système existent, mais elles souffrent généralement du travers de ne pas intégrer une optimisation spécifique de l’interprétabilité.

Dans ce projet IFP-in-RL, une méthodologie innovante est introduite pour la conception de tels systèmes. Cette méthodologie est basée sur la mise en œuvre d’une approche d’apprentissage par renforcement utilisant des métriques d’interprétabilité. L’objectif ici est d’intégrer la prise en compte et l’optimisation de l’interprétabilité souhaitée au cours de l’apprentissage même, et non a posteriori comme de nombreuses méthodes le font actuellement dans le domaine de l’XAI.

Le projet IFP-in-RL vise pour cela à réaliser, en amont, une étude complète, à la fois théorique et expérimentale, de métriques d’interprétabilité, incluant les critères numériques existants ainsi que les besoins des utilisateurs. Il s’agira de proposer une taxonomie des métriques existantes et de définir de nouvelles mesures si nécessaire, afin de compléter les précédentes et de permettre leur exploitation dans des algorithmes d’apprentissage par renforcement originaux. Une originalité de ce projet est d’intégrer une évaluation qualitative, menée auprès d’un panel humain, des métriques proposées mais aussi des bases de règles obtenues à l’issue de l’apprentissage par renforcement.

En termes applicatifs, le projet IFP-in-RL a pour objectif la mise en oeuvre de ces propositions pour le pilotage d'un drone, naviguant en toute autonomie pour assurer une mission consistant à survoler des points d'intérêt et les prendre en photo, à partir de données fournies par un simulateur.

Christophe Marsala (LIP6)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

TRT THALES Research and Technology
LIP6 LIP6

Aide de l'ANR 298 721 euros
Début et durée du projet scientifique : - 30 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.