La fabrique du mouvement artificiel – ARTIFACT
Les robots modernes restent confinés dans des environnements étroitement contrôlés et même les chorégraphies complexes que les humanoïdes de Boston Dynamics exécutent sans faille, dépendent fortement de la capture des mouvements, de stratégies de contrôle élaborées à la main et de modèles détaillés de l'espace de travail, qui laissent peu de place à la perception. En clair, les robots sont loin d'atteindre le niveau d'agilité et de dextérité, et encore moins l'autonomie, la robustesse et la sécurité nécessaires à leur déploiement "dans la nature" aux côtés de l'homme. Un bond en avant dans ces capacités est nécessaire pour qu'ils tiennent leurs promesses et sortent véritablement du laboratoire. Notre principe est que la clé de cette révolution est le développement des fondements théoriques et algorithmiques d'une véritable intelligence artificielle du mouvement, une IA qui doit relever le défi supplémentaire d'interagir physiquement avec des environnements en évolution dynamique et, en fin de compte, avec des personnes. Nous romprons avec la dichotomie entre le contrôle optimal, où le rôle de la perception est traditionnellement limité à une étape précoce d'estimation de l'état, et l'apprentissage par renforcement, où les politiques de contrôle sont généralement apprises sans modèle, sans garantie de faire face à la malédiction de la dimensionnalité. Concrètement, nous utiliserons le formalisme de Koopman des systèmes dynamiques complexes pour apprendre les modèles sensorimoteurs et les stratégies de contrôle correspondantes à partir des données des capteurs. Nous développerons des méthodes puissantes pour apprendre, contrôler et partager un dictionnaire de synergies sensorimotrices à travers les tâches, faisant écho à celles utilisées par le système nerveux central humain dans les tâches quotidiennes et accélérant l'acquisition de nouvelles compétences. Nous tirerons parti de la composition des stratégies sensorimotrices et des stratégies de recherche arborescente alimentées par des réseaux neuronaux pour planifier de manière optimale les mouvements du robot sous des contraintes d'observation dynamiques. Le cadre proposé sera mis en œuvre dans de nouvelles architectures logicielles de programmation différentiable et démontré sur plusieurs tâches de locomotion et de manipulation, à la fois en simulation et sur des robots réels.
Coordination du projet
Justin Carpentier (Institut National de Recherche en Informatique et en Automatique (INRIA) Centre Paris – Rocquencourt)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
INRIA Institut National de Recherche en Informatique et en Automatique (INRIA) Centre Paris – Rocquencourt
Aide de l'ANR 113 500 euros
Début et durée du projet scientifique :
décembre 2023
- 24 Mois