CE28 - Cognition, comportements, langage

Perception Gestuelle de la Parole: apprendre à percevoir la parole en intégrant biais inductifs liés au geste et apprentissage profond – GeSPer

Résumé de soumission

L'objectif global de ce projet transdisciplinaire est d'améliorer notre compréhension de la manière dont les humains apprennent à percevoir la parole et notre capacité à construire des machines capables de percevoir la parole. Cet objectif sera atteint en trois étapes.
Tout d'abord, nous utiliserons les techniques modernes d'apprentissage automatique pour prédire, à partir d'hypothèses sur les mécanismes d'apprentissage des bébés, les trajectoires développementales attendues dans différents environnements linguistiques. Cela nous permettra, pour la première fois, de tirer des conclusions concernant les mécanismes d'apprentissage des bébés à partir des trajectoires développementales observées empiriquement. En outre, si les données empiriques disponibles ne suffisent pas à trancher entre certains des mécanismes d'apprentissage considérés, nous utiliserons notre approche pour identifier de nouvelles expériences décisives. Nous faisons l'hypothèse que cette approche permettra de caractériser les mécanismes de l'apprentissage phonétique précoce chez le bébé plus finement qu'il n'a été possible jusqu'à présent.
Deuxièmement, motivés par des résultats récents établissant qu'un réseau cérébral complexe recrutant des zones « motrices » est déjà actif chez les très jeunes nourrissons et est impliqué dans la perception de la parole, nous visons également à introduire et à évaluer une nouvelle théorie du développement de la perception de la parole. L'idée centrale de cette théorie est que les nourrissons tirent parti de la nature gestuelle de la parole - le fait qu'elle résulte de l'enchaînement de gestes biologiques coarticulés d'un petit nombre d'articulateurs relativement lents - comme un biais inductif efficace pour un apprentissage purement perceptif. Pour évaluer cette hypothèse, nous l'inclurons parmi les mécanismes d'apprentissage considérés dans la première étape. Cela implique, afin de pouvoir réaliser les simulations nécessaires, de disposer d'une implémentation computationnellement efficace du mécanisme proposé, que nous développerons. Nous faisons l'hypothèse que l'inclusion d'un tel biais inductif « gestuel » dans les mécanismes d'apprentissage permettra de mieux prédire les trajectoires développementales observées à travers différents environnements linguistiques.
Enfin, nous testerons si l'inclusion d'un tel biais inductif « gestuel » dans des algorithmes d'apprentissage de représentation non supervisée à l'état de l'art peut également conduire à des avancées en traitement de la parole automatique, notamment en termes de quantité de données d'entraînement nécessaires, de robustesse et de transparence.

Coordination du projet

Thomas Schatz (UNIVERSITÉ AIX-MARSEILLE)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

LIS UNIVERSITÉ AIX-MARSEILLE
University of Maryland, College Park
IRIT UNIVERSITÉ DE TOULOUSE EPE

Aide de l'ANR 375 231 euros
Début et durée du projet scientifique : janvier 2026 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter