CE33 - Interaction, Robotique – Intelligence artificielle

Machines Morpho-fonctionelles en Essaim – MSR

Machines Morpho-fonctionelles en Essaim

Dans ce projet, nous nous intéressons à la robotique en essaim, où un grand nombre de robots avec une puissance de calcul et de communication limitée sont considérés. Notre objectif est de proposer de nouvelles méthodes de conception, avec un accent particulier sur la prise de décision collective utilisant à la fois le calcul morphologique et logique.

Nous visons un nouveau type de robots en essaim, les vibebots, où le facteur de forme garantit la dynamique du groupe. Nous rechercherons des comportements collectifs éduqués spécifiques.

Le terme intelligence en essaim est utilisé pour décrire des systèmes complexes où les comportements collectifs émergent de simples interactions locales entre individus. Ce phénomène peut être observé dans les systèmes naturels (par exemple, les insectes eusociaux) ainsi que mis en œuvre dans des systèmes artificiels (par exemple, la robotique en essaim), et implique des comportements tels que le mouvement collectif, la recherche de nourriture et la construction de nids.<br /><br />Nous nous intéressons à la robotique en essaim, où un grand nombre de robots avec une puissance de calcul et de communication limitée sont considérés. Notre objectif est de mieux comprendre les comportements intelligents des essaims dans la nature, et de proposer de nouvelles méthodes de conception, avec un accent particulier sur la prise en compte du rôle des interactions physiques entre les individus.<br /><br />L'hypothèse de construction découle de notre conviction que le rôle de l'incarnation a jusqu'à présent été négligé dans la robotique en essaim. Nous postulons que l'incarnation est essentielle et utile pour programmer des systèmes collectifs auto-organisés. Nous proposons ainsi de parvenir à une prise de décision collective en utilisant à la fois le calcul morphologique et logique en robotique en essaim.

Pour mener à bien le présent projet difficile, les deux IP doivent rassembler leurs connaissances, leurs compétences et leur créativité. Notre projet étant véritablement interdisciplinaire, nous veillons à maintenir une étroite collaboration à tous les niveaux et pour toutes fins, comme nous allons maintenant le démontrer.

Au niveau conceptuel, malgré une véritable différence de vocabulaire, qu'ils ont déjà commencé à réduire, à travers un lexique commun, les deux PI partagent une culture commune de systèmes autonomes collectifs (auto-organisation, réglage des paramètres de contrôle, calcul morphologique, optimisation, etc.). Cela permet une riche fertilisation croisée lors de la conduite des expériences et de l'analyse des résultats (WP3, WP4, WP5).

Notre approche combine (a) des expériences en matériel en s'appuyant sur les marcheurs granulaires que nous avons décrits précédemment et (b) des algorithmes de calcul évolutif (EC) et de diversité de qualité (QD) pour explorer l'ensemble des conceptions matérielles possibles intégrant un calcul logique nul ou minimal qui sont capable de correspondre à des critères quantifiables décrivant un comportement collectif souhaité.

Comme prévu initialement, nous avons démarré le projet à l'aide de Kilobots. un robot d'essaim à faible coût de 3,3 cm de haut (Rubinstein et al 2012 IEEE). Les kilobots sont dotés d'un dispositif de communication de diffusion isotrope basé sur IR (portée d'environ 70 mm), d'un capteur de lumière ambiante et de deux moteurs de vibration embarqués utilisés pour moduler la vitesse de translation et angulaire, le tout contrôlé par un processeur Atmega 328.

Nous avons rapidement évalué que l'ajout d'une plate-forme de vibration n'apporte aucune amélioration significative aux Kilobots et n'est donc plus une priorité. Après avoir mis en place une arène et un système d'acquisition et de traitement d'images, les expériences Kilobots sont menées dans une arène contrôlée par l'environnement. (D1.1).

Nous avons caractérisé la dynamique individuelle des Kilobots (D3.1). La principale conclusion est que les kilobots n'ont pas la capacité de base d'aller tout droit. De plus, il existe une grande variabilité de robot à robot, et les étalonnages ne sont pas robustes. Nous avons contourné ces lacunes en adaptant la morphologie des Kilobots en les complétant par des exosquelettes (voir C.3).

Nous avons obtenu trois résultats majeurs.
1) la conception de l'exosquelette nous permet de contrôler physiquement la propriété d'auto-alignement des Vibebots (D3.1)
2) nous avons étudié l'influence de la forme de l'exosquelette sur l'interaction physique entre les Vibebots lorsqu'ils entrent en collision. (D1.2).
3), nous avons développé un moteur de simulation pour étudier la dynamique des agents actifs avec des interactions d'alignement (D2.1). Nous démontrons deux effets importants. La réponse purement morphologique d'un essaim de Vibebots face à un obstacle dépend fortement de sa dynamique d'auto-alignement. Un cluster agrégé de Vibebots résiste à l'évaporation lorsqu'il est composé de Vibebots anti-alignement. Ici aussi, ce comportement collectif est purement d'origine morphologique.

Ayant obtenu des Vibebots robustes et dix fois plus rapides que les Kilobots, par la conception d'un exosquelette.
Ayant identifié une corrélation robuste entre la vitesse des Vibebots et sa propriété d'auto-alignement
Avoir une indication numérique que la propriété d'auto-alignement peut être utilisée comme primitive pour contrôler les interactions des Vibebots avec un obstacle ou avec d'autres Vibebots.
Ayant conçu un algorithme d'apprentissage distribué pour la robotique en essaim, faisant face à une communication limitée. Publié à l'IEEE CEC 2020, parmi les meilleurs candidats pour les articles étudiants (5 articles nominés).
Ayant étudié comment le choix conditionnel du partenaire dans l'apprentissage du robot dans un jeu coopératif permet une coopération socialement optimale en robotique en essaim dans des conditions spécifiques. Publié à ALIFE 2020 pour les résultats de la robotique en essaim, et en cours d'examen dans une revue de biologie évolutive pour la recherche fondamentale.

Nicolas Fontbonne, Olivier Dauchot and Nicolas Bredeche. Distributed On-line Learning in Swarm Robotics with Limited Communication Bandwidth. Proceedings of the IEEE Congress on Evolutionary Computation (CEC), 2020 (1 of 5 best student paper nominees).

Paul Ecoffet, Jean-Baptiste Andre´, Nicolas Bredeche. Learning to Cooperate in a Socially Optimal Way in Swarm Robotics. Published at the Conference on Artificial Life (ALIFE), 2020.

Paul Ecoffet, Nicolas Bredeche, Jean-Baptiste Andre´. Nothing better to do? Environment quality and the evolution of cooperation by partner choice. Preprint on Biorxiv (currently under review at JEB – journal of evolutionary biology)

Notre objectif est de proposer de nouvelles méthodes de conception pour la robotique en essaim qui puissent exploiter les interactions physiques entre individus. Notre principale hypothèse de travail est que l'encorporation ("embodiement"), au sens d'un robot interagissant physiquement avec son environnement et ses congénères, est une caractéristique essentielle pour la conception de comportements collectifs complexes. Il s'agit alors de combiner deux méthodes de calcul: celle de la morphologie computationnelle (ex.: les interactions physiques seules permettent l'alignement de particules) et celle issues d'une architecture logique de contrôle (ex.: un contrôleur embarqué permet de moduler les actions du robot via à travers ses effecteurs).

Ce projet véritablement interdisciplinaire combine les efforts conjoints d'un physicien à la fois expérimentateur et théoricien, dans le domaine des effets collectifs dans la matière active, et d'un expert en apprentissage automatique et robotique en l'essaim. Notre approche s'articule autour de (1) la conception robots dotés de propriétés physiques (typiquement la forme physique du robot) qui leur permettent d'obtenir directement des comportements collectifs et (2) le développement d'algorithmes évolutionnistes pour l'exploration et l'optimisation des espaces de recherche liés à l'architecture de contrôle logicielle embarquée, embarquée sur un dispositif de type system-on-chip, et exploitant les senseurs et effecteurs embarqués.

Dans un premier temps, nous souhaitons caractériser les phases dîtes "spontanées", c'est-à-dire les comportements collectifs que l'on peut obtenir à partir des seules interactions physiques entre robots (p.ex.: altération de la symmétrie) et avec l'environnement (p.ex.: densité de robots), avec comme seul apport d'énergie l'usage d'une table vibrante ou seront placés les robots. Dans un deuxième temps, nous caractériserons les phases "dîtes" opérationnelles, en utilisant un contrôle logiciel minimal permettant de moduler les actions des moteurs embarqués sur chaque robot et ainsi de passer d'une phase spontanée à l'autre. Enfin, dans un troisième temps, nous nous intéresserons à l'apprentissage de comportements collectifs lorsqu'un objectif, décrit en terme de comportements collectifs attendus, est donné au préalable.

En terme de protocole expérimental et de validation, nous nous baserons sur la réalisation de deux classes de comportements collectifs typiques. Nous étudierons le déplacement d'un essaim de robots auto-alignés selon des trajectoires non linéaires, résultant uniquement de décisions individuelles (i.e. absence de contrôle externe). Ensuite, nous explorerons les stratégies de contrôle logicielle permettant de moduler les interactions entre plusieurs essaims de robots: fusion d'essaims, rebond à la frontière, interpénétration en ligne ("laning"), etc... Alors que chaque essaim partage avec les autres le même type d'individu physiquement similaire, les paramètres de contrôle différents (vitesse, alignement, direction, etc.). Par exemple, nous attendons qu'une simple modulation sur la fréquence vibratoire auto-induite d'individus d'un même groupe soit suffisante pour moduler le comportement du groupe lors de sa rencontre avec un autre groupe aux propriétés vibratoires différentes (comportements de types liquides misciles ou non).

Coordination du projet

Olivier Dauchot (GULLIVER)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

ISIR Institut des Systèmes Intelligents et Robotiques
GULLIVER

Aide de l'ANR 596 700 euros
Début et durée du projet scientifique : décembre 2018 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter