Emergence de la communication par apprentissage par renforcement guidé par la curiosité en environnement multi-agent – ECOCURL
Quelles sont les conditions permettant l’émergence de systèmes de communication dans des populations d’agents artificiels? Comment ces systèmes de communication peuvent à leur tour soutenir l'acquisition de comportements coopératifs complexes ? Ces questions suscitent actuellement un intérêt considérable dans la communauté IA en raison de récents progrès en apprentissage par renforcement multi-agents. Des contributions ont montré comment une communication simple peut émerger dans des populations d'agents apprenant à résoudre une tâche coopérative. Cependant, ces contributions ne tirent pas parti de récents algorithmes étendant l'apprentissage par renforcement profond à la découverte et à l'apprentissage de multiples tâches en parallèle. Le projet ECOCURL étendra ces algorithmes à un environnement coopératif multi-agent réaliste, montrant comment un système de communication compositionnel peut être co-appris par les agents pour faciliter l'acquisition de compétences coopératives variées.
Coordination du projet
Clément Moulin-Frier (Centre de Recherche Inria Bordeaux - Sud-Ouest)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
INRIA Centre de Recherche Inria Bordeaux - Sud-Ouest
Aide de l'ANR 258 120 euros
Début et durée du projet scientifique :
January 2021
- 48 Mois