CE02 - Terre vivante 2020

L'Intelligence Artificielle pour Etudier la Communication Animale dans la Nature – WildCom-AI

L'Intelligence Artificielle pour Etudier la Communication Animale dans la Nature

L’étude du traitement cérébral de l’information permet de mieux comprendre comment les signaux de communication influencent les comportements. Cependant, les méthodes traditionnellement utilisées pour étudier le cerveau ne sont applicables qu’à un nombre limité d’espèces modèles. L’intelligence artificielle (IA) offre quant à elle de nouvelles perspectives pour modéliser les processus cérébraux et les étudier ainsi hors des laboratoires

Enjeux et Objectifs

Dans ce projet, nous utiliserons l’IA pour explorer les liens entre le traitement cérébral de l’information et les comportements complexes exprimés par des primates non-humains dans leur environnement naturel. Nous étudierons l’influence de la perception des visages sur les comportements socio-sexuels chez le mandrill (Mandrillus sphinx), un primate d’Afrique Centrale, en nous appuyant sur un programme de recherche à long terme étudiant une population de plus de 300 mandrills sauvages depuis 2012 au Gabon. Dans un premier temps, nous étudierons les liens entre la ressemblance faciale et la reconnaissance d’individus apparentés. Nous utiliserons l’IA et une base photographique de plus de 100 000 portraits de mandrills pour quantifier la ressemblance faciale entre les individus de la population étudiée. Nous explorerons les mécanismes permettant aux mandrills d’évaluer leur propre ressemblance aux autres individus avec lesquels ils interagissent quotidiennement, le lien entre la ressemblance parents-enfants et l’investissement parental, comment la ressemblance entre adultes permet de limiter les relations consanguines, et enfin dans quelle mesure les ressemblances faciales fortuites induisent, entre individus non apparentés, des biais comportementaux en tant que sous-produits de la sélection de parentèle. Dans un second temps, nous étudierons l’influence de l’efficacité du traitement cérébral de l’information sur les comportements socio-sexuels. Les sciences cognitives ont récemment révélé qu’un signal de communication traité efficacement dans le cerveau du récepteur a tendance à induire une évaluation positive de l’émetteur et des comportements d’attirance chez le récepteur. Ces résultats proviennent d’études menées chez les humains et en laboratoire, mais leurs implications chez les autres espèces et en milieu naturel sont inconnues. Dans ce projet, et pour la première fois en sciences cognitives, nous utiliserons l’IA pour quantifier l’efficacité du traitement de l’information dans le cerveau. Nous quantifierons l’efficacité du traitement des visages chez les mandrills et testerons l’hypothèse qu’un visage traité efficacement augmente l’attractivité visuelle et donc le succès reproducteur, l’intégration sociale et les soins parentaux.

1. Synthèse de Stimuli et Manipulation de l'Espace Latent

Pour isoler les traits de signalisation (sexe en particulier), nous avons utilisé des modèles génératifs de pointe, comme StyleGAN3. Contrairement aux versions précédentes, StyleGAN3 assure une continuité spatiale et l'absence de "replis" lors des manipulations. Nous avons projeté des images réelles de mandrills dans l'espace latent. La méthode a ensuite consisté à identifier des directions latentes (vecteurs) correspondant à des variables biologiques clés. En déplaçant les images le long de ces axes, nous avons généré des stimuli "édités" où seul un trait cible varie, permettant une isolation parfaite du signal tout en maintenant l'identité et le réalisme écologique du sujet.

 

2. Modélisation de la Perception et Classification (Approche par CNN)

Contrairement à la simple classification, nous avons utilisé les réseaux de neurones comme des proxies du système visuel des primates.Les travaux de Tieo et al. s'appuient sur des architectures CNN pour modéliser la perception des signaux sociaux. Ces modèles ont été entraînés à catégoriser des traits à partir d'images brutes. L'analyse des cartes d'activation de ces réseaux permet d'identifier les zones morphologiques critiques (ex : crêtes nasales, zones colorées) qui portent l'information sociale. Dans un volet spécifique portant sur la sénescence (Renoult et al. 2025), les Vision Transformers ont été mobilisés pour leur capacité supérieure de prédiction. Toutefois, cet usage est resté strictement prédictif (performance technique) et n'a pas été utilisé pour modéliser les mécanismes de perception biologique, contrairement aux CNN.

 

3. IA et Traitement de l'Information :

Le projet explore également les bases computationnelles des préférences visuelles. Hypothèse du Selon l'approche développée dans Dibot et al. (2023), nous avons analysé la réponse des couches internes des réseaux de neurones profonds. La méthode consiste à calculer la parsimonie (sparsity) des activations neuronales lors de l'exposition à un signal. Nous avons testé si les signaux considérés comme "attractifs" ou "efficaces" induisent des motifs d'activation plus parcimonieux (moins de neurones activés, mais de manière plus intense). Cette approche permet de lier la complexité mathématique du traitement de l'image à la valeur adaptative du signal social.

 

4. Validation Expérimentale et Comportementale

Enfin, la validité des modèles d'IA a été confrontée à la réalité biologique par des tests comportementaux. Les stimuli synthétiques produits par StyleGAN3 ont été présentés à des primates en milieu contrôlé (Dibot et al., en révision dans Animal Behavior). Le temps de fixation oculaire a été mesuré pour quantifier l'intérêt social ou l'attractivité. La méthode finale a consisté à corréler les préférences comportementales observées avec les métriques issues de l'IA (scores de classification des CNN et indices de parsimonie).

Le projet WildCom-AI a abouti à des avancées significatives, tant sur le plan de la théorie de l’évolution que sur celui des outils technologiques mis à disposition de la communauté scientifique.

 

1. La Base de Données WildCom

 

L'un des piliers concrets du projet est la constitution d'une base de données photographiques unique au monde. Nous avons rassemblé et standardisé une collection de 100 000 photosgraphies de mandrills suivis en milieu naturel. Cette base a fait l'objet d'un Data Paper dédié et est désormais accessible en libre accès. Elle constitue selon nous une ressource importante pour les travaux futurs en écologie visuelle et en vision par ordinateur appliquée à la faune sauvage.

 

2. Sparsité et Beauté : Les travaux menés par Dibot et al. ont permis de jeter un pont entre les neurosciences computationnelles et la sélection sexuelle. Nous avons démontré qu'il existe un lien statistique robuste entre la sparsité (parsimonie) des activations neuronales dans les réseaux de neurones profonds et la préférence visuelle. Plus un signal est traité de manière "efficace" par le système visuel, plus il est perçu comme attractif. Dans une étude comparative (Tieo et al., 2024), nous avons également montré que la sparsité est un meilleur prédicteur de la beauté que la typicalité statistique (le fait qu'un visage soit "moyen" ou représentatif de la population). Ce résultat suggère que l'évolution des signaux tend vers une optimisation de l'efficacité du traitement de l'information plutôt que vers une simple conformité à la moyenne.

 

3. Signaux Sociaux chez le Mandrill :

 

L'article publié dans iScience (Sonia Tieo et al.) a apporté un éclairage nouveau sur la perception des signaux de féminité/masculinité chez les primates non-humains. Contrairement aux modèles humains où une certaine forme de féminité faciale est souvent associée à des bénéfices sociaux ou sexuels, nos résultats montrent que chez les mandrills, le lien entre morphologie et bénéfices sociaux favorise les individus très masculins. L'étude démontre que la "masculinité" faciale est un signal honnête de rang et de succès reproducteur, orientant les préférences sociales vers des traits marqués, à l'inverse des tendances observées dans de nombreuses études sur la perception humaine.

 

4. Validation Expérimentale par l'IA Générative

 

Le projet a également validé une méthodologie innovante de création de stimuli via StyleGAN3, permettant de passer de l'observation à l'expérimentation. Nous avons publié la méthode permettant de générer des stimuli synthétiques pour tester expérimentalement les corrélations observées sur le terrain. Les tests comportementaux (looking-time assays) ont confirmé la capacité des primates à traiter ces images de synthèse comme des congénères réels. Bien que ces tests n'aient pas montré de différences de préférence massives pour le caractère "plus masculine", nous avons démontré un apport technique crucial : la manipulation de l'orientation des visages.

Le caractère multidimensionnel de l'attractivité visuelle

 

Bien que nos travaux aient établi la sparsité des activations neuronales comme un prédicteur robuste de la préférence, ce paramètre n'épuise pas la complexité du concept de "beauté" ou d'attractivité biologique. La sparsité modélise principalement l'efficience du codage, mais elle ne rend pas compte de la valeur sémantique ou hédonique profonde des signaux. Un signal peut être traité de manière efficiente par le système visuel sans pour autant déclencher une réponse comportementale positive (ex: un signal de menace peut être très parcimonieux mais non attractif). Il est nécessaire de développer des modèles intégrant d'autres dimensions de la perception pour compléter la métrique de l'efficience.

 

Modélisation de l'attention sélective

 

L'utilisation des CNN nous a permis de comprendre le traitement global des traits, mais ces modèles peinent à simuler la hiérarchisation dynamique des informations par le regard. Le recours aux Vision Transformers (ViT) représente ici un verrou à lever. Contrairement aux CNN, les mécanismes d'attention des ViT permettent de modéliser mathématiquement comment un individu focalise ses ressources cognitives sur des détails spécifiques d'un visage (ex: l'éclat d'une couleur ou la texture d'une crête nasale). L'objetif sera d'intégrer des cartes d'attention pour prédire quelles zones du stimulus capturent le regard en premier lors des tests comportementaux.

 

Quantification de la complexité perçue

 

Un autre verrou identifié concerne l'équilibre entre efficience (sparsité) et complexité visuelle. En psychologie cognitive, on sait que l'attractivité suit souvent une courbe en U inversé par rapport à la complexité : un stimulus trop simple est ignoré, un stimulus trop complexe est rejeté. Dans le futur, il faudra utiliser l'IA pour quantifier la complexité perçue des signaux de communication chez les mandrills. La modélisation devra permettre de distinguer la "complexité structurelle" (morphologie) de la "complexité de traitement" (coût cognitif). Il nous faudra développer des métriques hybrides combinant entropie de l'image et profondeur de traitement dans les réseaux de neurones.

 

Dynamisme et "vivacité" des stimuli

 

Le passage du statique au dynamique reste un défi technique majeur. Si l'IA générative via StyleGAN3 a permis de manipuler l'orientation des visages pour rendre les portraits plus "vivants", le contrôle total de la micro-gestuelle faciale (mouvements des lèvres, clignements d'yeux) reste complexe à automatiser sans perdre l'intégrité du signal biologique. L'exploration des Video GANs ou des modèles de diffusion temporelle sera cruciale pour modéliser la perception des signaux en mouvement, dimension essentielle de la communication sociale réelle.

En cours

L’étude du traitement cérébral de l’information permet de mieux comprendre comment les signaux de communication influencent les comportements. Cependant, les méthodes traditionnellement utilisées pour étudier le cerveau ne sont applicables qu’à un nombre limité d’espèces modèles. L’intelligence artificielle (IA) offre quant à elle de nouvelles perspectives pour modéliser les processus cérébraux et les étudier ainsi hors des laboratoires. Dans ce projet, nous utiliserons l’IA pour explorer les liens entre le traitement cérébral de l’information et les comportements complexes exprimés par des primates non-humains dans leur environnement naturel. Nous étudierons l’influence de la perception des visages sur les comportements socio-sexuels chez le mandrill (Mandrillus sphinx), un primate d’Afrique Centrale, en nous appuyant sur un programme de recherche à long terme étudiant une population de plus de 300 mandrills sauvages depuis 2012 au Gabon.
Dans un premier temps, nous étudierons les liens entre la ressemblance faciale et la reconnaissance d’individus apparentés. Nous utiliserons l’IA et une base photographique de plus de 19 000 portraits de mandrills pour quantifier la ressemblance faciale entre les individus de la population étudiée. Nous explorerons les mécanismes permettant aux mandrills d’évaluer leur propre ressemblance aux autres individus avec lesquels ils interagissent quotidiennement, le lien entre la ressemblance parents-enfants et l’investissement parental, comment la ressemblance entre adultes permet de limiter les relations consanguines, et enfin dans quelle mesure les ressemblances faciales fortuites induisent, entre individus non apparentés, des biais comportementaux en tant que sous-produits de la sélection de parentèle.
Dans un second temps, nous étudierons l’influence de l’efficacité du traitement cérébral de l’information sur les comportements socio-sexuels. Les sciences cognitives ont récemment révélé qu’un signal de communication traité efficacement dans le cerveau du récepteur a tendance à induire une évaluation positive de l’émetteur et des comportements d’attirance chez le récepteur. Ces résultats proviennent d’études menées chez les humains et en laboratoire, mais leurs implications chez les autres espèces et en milieu naturel sont inconnues. Dans ce projet, et pour la première fois en sciences cognitives, nous utiliserons l’IA pour quantifier l’efficacité du traitement de l’information dans le cerveau. Nous quantifierons l’efficacité du traitement des visages chez les mandrills et testerons l’hypothèse qu’un visage traité efficacement augmente l’attractivité visuelle et donc le succès reproducteur, l’intégration sociale et les soins parentaux.
Nos hypothèses scientifiques seront étudiées chez la population sauvage de mandrills à l’aide d’analyses de corrélation, mais aussi par des approches expérimentales avec des mandrills issus d’une grande population captive. Pour la première fois dans les sciences du comportement, nous utiliserons les nouveaux modèles d’IA générative pour synthétiser des signaux de communication complexes (des visages de mandrills), tout en contrôlant le sens de leur variation. Nous les utiliserons pour modifier la ressemblance entre visages et l’efficacité de leur traitement dans des visages de synthèse. Les visages synthétisés seront présentés à des mandrills captifs, lors de tests expérimentaux à grande échelle, afin de tester l’effet sur leurs comportements de la ressemblance faciale et de l’efficacité du traitement cérébral de l’information.
Ce projet propose d’explorer de nouvelles applications de l’IA (modélisation du traitement cérébral de l’information, synthèse de stimuli) pour l’écologie et la biologie évolutive. Tandis que la vaste majorité des études à l’interface entre IA et écologie visent à caractériser la diversité des organismes vivants et leurs interactions, ce projet apportera, lui, un éclairage inédit sur les processus déterminant ces interactions.

Coordination du projet

Julien RENOULT (Centre d'Ecologie Fonctionnelle et Evolutive)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

CEFE Centre d'Ecologie Fonctionnelle et Evolutive

Aide de l'ANR 364 546 euros
Début et durée du projet scientifique : novembre 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter