IA FR-DE - Type 2 RD - Appel à projets bilatéral franco-allemand en intelligence artificielle (MESRI-BMBF) - Type 2 Recherche et Développement 2021

Affordable Artificial Intelligence – AffAI

Résumé de soumission

La proposition "Affordable AI" (AffAI) s'attaque à trois des principaux verrous bloquant la révolution de l'IA dans l'industrie:

* une expertise considérable est requise pour construire des systèmes intelligents. La sélection des chaines de traitements (pipelines: algorithmes et hyper-parametres), appelée AutoML, requiert des ressources computationnelles toujours croissantes, qui n'est pas soutenable et ne passe pas à l'échelle.

* les modèles boite-noire ne répondent pas aux objectifs de robustesse, transparence et équité.

* de nombreux secteurs industriels disposent uniquement de "small data" (contrastant avec l'abondance des données sous-tendant les avancées emblématiques de l'IA). L'expertise des humains doit être mise à contribution pour pallier le manque de données.

AffAI repose sur un consortium comprenant 2 Universités majeures, de niveau international en IA : Univ. Paris-Saclay et TU Dortmund University; et 2 PMEs spécialisées en IA, machine learning et optimisation: RapidMiner (RM) and MyDataModels (MDM). Ce consortium dispose de toutes les compétences requises pour: i) comprendre les besoins réels de l'industrie; ii) concevoir des solutions efficaces innovantes, reposant sur, et adaptant, le meilleur état de l'art; iii) implémenter ces solutions de manière professionnelle et ergonomique; iv) garantir leur dissémination à travers un ensemble de grands comptes clients de RM et MDM, et une communauté d'utilisateurs comprenant 700,000 membres.

Ces trois verrous seront attaqués en combinant les expertises complémentaires du consortium:

1. AutoML sera étendu au cadre de l'optimisation multi-critères: outre le critère de performance en prédiction, des critères tels que la frugalité du modèle, son intelligibilité, ou le respect des contraintes propres du domaine, sont également importants pour la chaine de valeur.
Un des aspects les plus innovants de la proposition concerne l'AutoML embarqué, permettant l'entrainement des systèmes intelligents "on-board", sous contrainte des ressources disponibles.

2. Deux fonctionalités permettront d'ouvrir la boite noire des modèles appris: une analyse de sensibilité (indiquant comment la décision du système dépend du cas courant et du contexte) et un modèle causal. Ce dernier, caractérisant les dépendances entre les variables de contrôle et les observables du phénomène étudié, permettra de manière originale la conception d'interventions, visant à modifier les variables contrôlables pour obtenir les effets désirés.

3. L'insuffisance des données, et les spécifications possiblement incomplètes du système intelligent visé, seront prises en compte en faisant appel à l'expert humain dans la boucle d'apprentissage. En premier lieu, l'apprentissage actif (demandant à l'expert de labeller quelques douzaines de cas, apportant une information optimale) permettra d'augmenter l'information disponible. En second lieu, les modèles compatibles avec les données disponibles seront itérativement présentés à l'expert, qui choisira le modèle le plus approprié compte tenu du contexte et de ses préférences. Ce dialogue permettra d'estimer graduellement un modèle des attentes et préférences de l'expert, et ce modèle sera utilisé pour faconner le comportement du système intelligent visé.

La validation et le transfer des fonctionalités proposés seront réalisés selon un mécanisme original à 2 niveaux:

* Les 2 PMEs mettront à disposition du consortium 2 cas d'usage représentatifs (en maintenance préventive et optimisation de processus) sur lesquels ils partageront les données et leur expertise;
* Les fonctionalités seront validées d'abord sur ces cas d'usage;
* Dans une 3e phase, les fonctionalités seront évaluées dans le cadre d'applications industrielles similaires et confidentielles. Les PMEs seront ainsi à même d'évaluer la robustesse et la généralité des fonctionalités, et de les consolider dans le cadre d'une interaction itérée avec les laboratoires et leurs clients industriels.

Michèle SEBAG (Laboratoire Interdisciplinaire des Sciences du Numérique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

TU Dortmund University
MDM MyDataModels
RM RapidMiner
UPSay Laboratoire Interdisciplinaire des Sciences du Numérique

Aide de l'ANR 0 euros
Début et durée du projet scientifique : septembre 2021 - 36 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.