ANR-DFG - Appel à projets générique 2022 - DFG 2022

Peau et mouvements corps complet avec de large objets par des robots humanoïdes contrôlés en couple et en position – HoRoPo

HoRoPo : la robotique humanoïde avec de la peau pour soulever, porter, anticiper

L’objectif de HoRoPo est de développer un nouveau paradigme scientifique pour la génération de mouvement, en considérant des robots humanoïdes équipés d’une peau. Il s’agit de manipuler de grands objets à l’aide de robots humanoïdes contrôlés en couple et non contrôlés en couple, de comparer les limites des deux approches et de les fusionner en un contrôleur unifié.

Manipulation d’objets encombrants via le contrôle prédictif basé modèle corps complet et le contrôle d’actionneurs en couple.

Les êtres humains manipulent des objets de taille importante grâce au toucher non seulement celui obtenu par leurs mains mais également par les importantes informations fournies par leur peau. Du point de vue technologique l’utilisation de capteurs de couple permet également d’obtenir des informations sur les forces appliquées à un corps mais il ne permet d’obtenir la localisation du point de contact. La peau permet d’obtenir cette dernière information non seulement pour un contact, mais également à de multiples endroits. Un des buts de ce projet est de déterminer s’il est possible de se passer des capteurs de couple qui sont présents sur le robot humanoïde TALOS. Ceux ci sont en effet particuliérement coûteux même s’ils permettent d’avoir des comportements très similaires à ceux d’un être humain. Les autres buts de ce projet sont d’estimer les paramètres physiques d’un objet à travers l’utilisation de la peau, et finalement de mettre en place des stratégies de manipulation d’objets en utilisant cette information tactile et le corps complet du robot grâce à des techniques avancées d’optimisation. Dans le cadre ce projet nous avons notamment utilisé un solveur permettant de générer très rapidement des trajectoires prenant en compte le corps complet d’un robot sur un intervalle de temps d’une à deux secondes.

L’approche scientifique développée dans le cadre du projet s’est effectuée dans le cadre des 3 problèmes énoncés, avec comme contexte applicatif l’utilisation des robots disponibles dans les laboratoires. En Allemagne, c’est un robot humanoïde REEM-C, contrôlé en position, qui était disponible. En France, c’est le robot humanoïde TALOS, qui est contrôlé en force qui était disponible.

 

Planification de haut niveau. La planification de haut niveau dans le contexte de ce projet aurait pu être la séquence de contacts afin de manipuler un objet. On peut par exemple ainsi planifier le retournement d’un objet. Toutefois afin de mettre en place un tel mécanisme il est nécessaire d’avoir un système de génération de mouvements continus pour une séquence de contacts demandée. Dans le cadre du groupe Gepetto nous avons développé depuis de nombreuses années une approche basée sur le contrôle prédictif corps complet. Le problème d’optimisation associé est résolu par la programmation dynamique différentielle, en utilisant le logiciel Crocoddyl. Afin d’explorer l’utilisation de Crocoddyl sur le robot TALOS, nous avons dans un premier temps limité la modélisation des contacts aux patchs de la peau. Nous avons du également prendre en compte le fait que le système étant contrôlé en couple, la dynamique des actionneurs contrôlés peut être instable par rapport aux gains issus de l’analyse en sensibilité.

 

Contrôle des forces d’interaction bas niveau au niveau des contacts

Le contrôle des forces en interaction bas niveau était initialement prévu en se basant sur les gains de Ricatti issus du contrôleur prédictif corps complet. En effet la théorie nous indique qu’entre deux problèmes d’optimisation correspondant à deux itérations successives du MPC, certains gains de l’algorithme DDP permettent de calculer l’extension de Taylor entre les deux solutions. La vérification de cette hypothèse s’est avérée particuliérement importante pour la suite des travaux.

Un autre aspect qui s’est avéré crucial dans la suite des travaux effectués est le fait que les capteurs fournis par la société InTouch Robotics ont une calibration partielle : ils sont calibrés pour fournir la même sortie mais pas une estimation de la force. Une partie des travaux effectués à donc consister à developper une méthode afin de calibrer ses forces. Enfin afin de pouvoir modéliser les contacts, il est nécessaire de pouvoir simuler les contacts avec l’environnement.

 

Estimation des paramètres d’un objet inconnu en utilisant les capteurs tactiles et les capteurs des joints des robots.

 

Nous avons également travaillé sur l’estimation des paramètres d’un objet lorsque celui ci est manipulé par un robot équipé de peau. Il est nécessaire d’abord d’estimer son poids et son centre de masse, puis ses paramètres inertiels. Nous avons pour cela essentiellement exploité les particularités de notre robot TALOS équipé de capteurs de couple, lui permettant de mesurer les forces aux moteurs et à la peau.

Déploiement du contrôleur corps complet.

Le déploiement du contrôleur corps complet s’est avéré beaucoup plus compliqué que prévu. En effet dans le cadre du contrôl prédictif considérant le modèle complet du robot il est apparu que l’apparition et la disparition des phases avaient un impact non négligeable sur les temps de calcul. En effet ceux-ci ont fluctué entre 20 ms et 60 ms suivant si le robot restait debout sans bouger, ou s’il effectuait des transitions de contact. Le retard devient alors important, et il est apparu nécessaire de prendre en compte ce retard de manière appropriée. Enfin les gains de Ricatti, ou gains de « feedback » calculent l’importance de la différence entre la simulation du modèle dans son état présent et le but recherché. Cependant ses gains peuvent s’avèrer être déstabilisant pour l’actionneur contrôlé, qui lui est très bruité de manière générale au second ordre. Il a donc fallu mettre en place une stratégie de filtrage permettant d’éviter qu’une telle instabilité ne se mette en place. Ces deux aspects on eu un impact important sur le robot qui s’est additionné à des problèmes techniques. En effet la non prise en compte des retards, a introduit des oscillations au niveau du couple qui ont eu probablement un impact négatif sur la mécanique du système. De plus le robot étant un prototype il s’est avéré que le choix des connecteurs n’était pas bon dans le contexte de la robotique humanoïde. Ceux ci se déconnectaient très souvent et la mise en place des expériences s’est avérée difficile pour ces nombreuses raisons. A part les problèmes techniques du robot, les problèmes soulevés par la mise en œuvre du contrôleur prédictif corps complet a fait l’objet d’une publication à la conférence Internationale sur la robotique humanoïde en 2024. Ce papier correspond au déliverable D2 du projet, c’est à dire qu’il explique la mise en œuvre du contrôleur prédictif corps complet sur le robot TALOS.

 

Estimation des paramètres d’un objet inconnu en utilisant les capteurs tactiles et les capteurs des joints des robots.

Les résultats obtenus sur ce problème ont été publiés dans l’article de conférence. Le comportement est basé sur un contrôleur corps complet lui même contrôlé par une machine d’état. Cette machine d’états instancie une séquence de mouvements : Reach, Grasp, Manipulate, Finish en créant les problèmes d’optimisation corps complet associés. Ceux ci intégrent les phases de contact, les trajectoires des organes terminaux, et la partie contrôle prédictif basé modèle sur une fenêtre glissante. Les trajectoires générées le sont en fonction des phases définies, et permettent ensuite de calculer le torque souhaité en sortie d’axe ainsi que les gains appliqués par le contrôleur linéaire à 2 Khz.

Le projet nous a permis de réaliser un certain nombre d’objectifs liés notamment à la mise en place de la peau sur le robot humanoïde TALOS ainsi que l’approche de contrôle prédictif corps complet en couple. Celle-ci s’est avérée particuliérement complexe à mettre en œuvre pour plusieurs raisons. La première tient à la complexité du problème à résoudre qui peut avoir des temps de résolutions variables et qu’il est donc particuliérement important de bien gérer les délais de résolutions du problème. De plus parce qu’il s’agit de contrôle en couple il est nécessaire de bien prendre en compte la dynamique des actionneurs. Ceci a été résolu en partie dans le premier article de conférence qui a été primé. Enfin d’un point de vue purement technique, le robot TALOS disponible au LAAS est le premier de ce type, et il souffre de problèmes de conception notamment au niveau des connecteurs. Ceci rend particuliérement pénible les expériences sur le robot. Heureusement le projet a bénéficié de la collaboration proche entre le LAAS et PAL Robotics à travers le laboratoire joint Dynamograde qui a permis le support permanent d’un ingénieur de PAL Robotics. Ceci a été fait hors financement du projet, mais sans celui ci aucun des travaux présentés n’aurait été possible.

D’un point de vue scientifique et technique le projet va également bénéficier des travaux mis en place dans le cadre du projet AGIMUS. En effet tous les travaux effectués par Rajesh Subburaman ont été effectués sous ROS-1 qui n’est actuellement plus supporté. Mais une grosse partie du portage des codes a été fait et il devrait être assez facile de les porter en ROS-2.

C’était d’ailleurs le sens du travail d’évaluation effectué sur le simulateur Gazebo Harmonic et notamment avec le simulateur DART. Il est à rapprocher de l’analyse pointue effectuée par l’équipe WILLOW INRIA sur la modélisation des contacts par des approches dites de descentes alternées par multiplicateur de Lagrande (ADMM). DART est très proche en terme de stabilité en utilisant des projecteurs de Gauss Seidel.

En parallèle l’équipe GEPETTO du LAAS a exploré des méthodes de contrôle utilisant l’ apprentissage par renforcement via d’autres financement. Elles sont très proches en termes scientifiques à part la partie mémoire des réseaux de neurones. Ce projet est un excellent point de départ pour de futurs projets exploitant la modalité du toucher pour construire des modéles dits de Vision-Langage-Action (VLA) avec l’information de contact et des exemples d’actions fournis par le contrôle prédictif corps complet.

Le but d'HoRoPo est de développer un nouveau paradigme scientifique pour la génération de mouvements des robots humanoïdes équipés d'une peau artificielle.
Cela permettra de manipuler des objets de grandes tailles avec des robots contrôlés en couple et des robots dont les actionneurs sont contrôlés en position.
Les limitations des deux approches seront évaluées et fusionnées dans un contrôleur uniforme. L'axe scientifique sera de développer un contrôle prédictif basé modèle qui exploite les avantages de la peau, le contrôle en couple ou en position avec l'ensemble du modèle du robot. Un verrou important à résoudre est la complexité liée aux nombre de contacts créer par l'objet interagissant sur le robot. HoRoPo va donc explorer et exploiter le potentiel de la peau pour le contrôle corps-complet pour la manipulation.

Le projet se basera sur le travail de l'équipe Allemande (TUM-ICS) sur la peau et sur celui de l'équipe Française (LAAS-Gepetto) sur le contrôle prédictif corps-complet. La première équipe a réalisé des avancées impressionnantes sur la transmission d'information de contact via des patches de peau artificiels les rendant accessibles et techniquement gérable. La deuxième équipe a proposé un nouvel algorithme nommé Crocoddyl pour le contrôle prédictif basé modèle pour calculer le mouvement corps complet d'un robot humanoïde avec retour d'état. TUM-ICS a déjà équipé un robot humanoïde de type REEM-C nommé H1 de grande taille avec une peau artificielle, et généré des mouvements corps complet sans contrôle en couple.Il y a 5 ans, LAAS-Gepetto a proposé des améliorations par rapport au robot humanoïde REEM-C, de façon à avoir un robot humanoïde puissant et capable de contrôler en couple chacun de ses actionneurs.
L'ambition d'HoRoPo est d'équiper un robot contrôlé en couple (TALOS) avec une peau pour manipuler des objets particulièrement lourds et d'investiguer des stratégies comparables sur un robot contrôlé en position (H1). Le LAAS-GEPETTO va étendre la formulation de Croccodyl pour gérer de multiple contacts, et permettre de modifier en ligne le comportement futur en fonction de l'état du robot. Une difficulté principale avec les mouvements corps-complet est la richesse des trajectoires possibles, ce qui malheureusement peut conduire l'algorithme a être capturé dans des minima locaux. Pour résoudre ce problème, une approche innovante est d'utiliser des techniques d'apprentissage pour reconnaitre la solution la plus probable en fonction de la situation. Ceci est réalisé grâce à une exploration statistique des instances de situations les plus probables.
Le prototype de peau développé à TUM-ICS fournit des capacités de perception multimodales incluant la pression, la température et l'accélération. Il a déjà été utilisé pour couvrir le robot H-1 et effectuer des recherches sur le contrôle de l'équilibre et de la marche intégré dans une suite logicielle. Dans HoRoPo, TUM-ICS va joindre ses forces avec le LAAS-Gepetto pour travailler à l'extension de ces capacités à la manipulation corps-complet. TUM-ICS focalisera sur la détection et le contrôle multi-contact d'un robot humanoïde avec des capacités de contrôle en position et en couple. Les nouveaux schémas de contrôle développés dans HoRoPo vont ouvrir une nouvelle ligne de recherche en robotique humanoïde. De telles avancées technologiques vont avoir un impact qui vont au delà de la robotique humanoïde actuelle et vont accroître l'utilisation de ces robots à travers de multiples domaines d'applications.

Coordination du projet

Olivier STASSE (Laboratoire d'analyse et d'architecture des systèmes)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

TUM - ICS Technical University of Munich - Institute of Cognitive Sciences
LAAS-CNRS Laboratoire d'analyse et d'architecture des systèmes

Aide de l'ANR 310 750 euros
Début et durée du projet scientifique : janvier 2023 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter