CE23 - Intelligence artificielle et science des données

Apprentissage auto-supervisé efficient pour des technologies de la parole inclusives et innovantes. – E-SSL

Résumé de soumission

L’apprentissage auto-supervisé (Self-Supervised Learning ou SSL) a émergé récemment comme une méthode d’intelligence artificielle (IA) incroyablement prometteuse. Grâce à cette méthode, les colossales masses de données non annotées qui sont accessibles peuvent être utilisées par des systèmes d’IA pour dépasser les performances connues jusque-là. En particulier, le domaine du traitement automatique de la parole (TAP) se voit rapidement transformé par l’arrivée du SSL grâce, notamment, aux investissements industriels massifs et l’explosion des données, tous deux mis à disposition par une poignée d’entreprises. Les gains en performance sont impressionnants, mais la complexité des modèles SSL impose aux chercheurs et industriels du secteur de se doter d’une capacité de calcul hors normes réduisant drastiquement à la fois l’accès à la recherche fondamentale sur cette thématique, ainsi que son déploiement dans des produits du quotidien. Par exemple, une grande partie des travaux utilisant un modèle SSL pour le TAP reposent sur un système entretenu et mis à disposition par une seule et même entreprise (wav2vec 2.0). L’intégralité du cycle de vie de la technologie, en partant de ses fondations théoriques jusqu’à son déploiement pratique, en passant par l’analyse des aspects sociétaux, dépend donc uniquement d’institutions ayant les moyens physiques et financiers de soutenir l’intensité du développement de cette technique. Le projet E-SSL vise à redonner à la communauté scientifique et aux industriels du TAP le contrôle nécessaire sur l’apprentissage auto-supervisé afin d’assurer son évolution et un déploiement égalitaire en facilitant à la fois la recherche académique et son transfert vers l’industrie. En pratique, E-SSL intègre de façon holistique trois problèmes clés de l’apprentissage auto-supervisé pour le TAP incluant son efficience computationnelle effective, son impact sociétal ainsi que la faisabilité de son extension aux produits de demain.

Coordination du projet

Yannick ESTÈVE (Université Avignon et Pays du Vaucluse)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LAMSADE Université Paris Dauphine
LIA Université Avignon et Pays du Vaucluse
LIG Laboratoire d'Informatique de Grenoble

Aide de l'ANR 469 468 euros
Début et durée du projet scientifique : décembre 2022 - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter