Apprentissage par renforcement pour des agents autonomes en environnement naturel – R3AMA
L'apprentissage par renforcement a récemment donné des résultats exceptionnels dans un large éventail de tâches, en particulier pour les jeux vidéo. Ces agents ont été capables de résoudre aussi bien des jeux nécessitant des actions rapides que des décisions bien planifiées. Appliqués à la robotique, ces agents ont souvent surpassés leurs homologues à commande classique. Les progrès récents dans la manipulation robotique et la locomotion des robots à pattes illustrent leurs capacités sur des tâches de contrôle continu de faible dimension. De plus, l'avènement du RL, des réseaux de neurones (NN) et des dispositifs embarqués toujours plus efficaces offrent la possibilité de déployer des politiques sensorimotrices performantes en temps réel. Cependant, des défis majeurs demeurent : contrairement aux politiques de basse dimension, les simulateurs capables de recréer des environnements haute-fidélité sont lents, et l'apparence de leurs environnements reste largement différente du monde réel. C'est notamment le cas pour les applications extérieures, où la complexité de l'environnement est bien plus élevée qu'en intérieur. Il en résulte un écart entre ce qui peut être simulé et les environnements de déploiement.
Les principaux développements proposés dans ce projet sont donc axés sur le développement de solutions d'apprentissage par renforcement applicables à des systèmes robotiques réels fonctionnant dans des environnements non structurés avec des capteurs réels. En particulier, l'apprentissage par renforcement sera appliqué aux tâches sensorimotrices, à la coordination de tâches sur un seul agent et à la coordination de tâches entre agents dans un environnement partagé. Ces contributions s’appuieront, entre autre, sur l'apprentissage par renforcement basé sur des modèles.
Deux cas d'utilisation seront considérés : l'automatisation de bateaux robotisés utilisés pour la collecte des déchets et l'automatisation de la capture de débris spatiaux avec des satellites robotisés.
Coordination du projet
Cédric Pradalier (GEORGIATECH-CNRS)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
GEORGIATECH-CNRS
IADYS
Aide de l'ANR 422 048 euros
Début et durée du projet scientifique :
décembre 2023
- 42 Mois