CE23 - Intelligence Artificielle

Modelisation Microscopique de l'Intelligibilité – MIM

Résumé de soumission

Le projet a 2 objectifs: a) rendre la reconnaissance automatique de parole des machines plus "humaine"; b) valider nos connaissance sur la perception de la parole grâce au traitement de données. MIM proposera des modèles qui prédisent la reconnaissance vocale humaine avec une résolution fine. Les approches actuelles d'intelligibilité fournissent des estimations macroscopiques constituées d'agrégats sur de nombreux stimuli et auditeurs. En s'appuyant sur les développements de l'IA, les modèles pourraient prédire la reconnaissance au niveau sous-lexique. Le "Deep Learning" (DL) a amélioré les performances de la reconnaissance automatique de la parole, en obtenant résultats surhumains. Nous prévoyons de construire des modèles DL pour prédire les réponses humaines aux tests d'intelligibilité dans le but d'améliorer l'individualisation des solutions auditives. La rareté et variabilité des données expérimentales, ainsi que le problème d'interprétation du DL sont deux des principaux verrous à aborder.

Coordination du projet

Ricard Marxer (Laboratoire d'Informatique et Systèmes)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIS Laboratoire d'Informatique et Systèmes

Aide de l'ANR 286 934 euros
Début et durée du projet scientifique : août 2021 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter