Antennes acoustiques hétérogènes et non contraintes pour la communication parlée – DiSCogs
DiSCogs vise à résoudre certains problèmes fondamentaux de traitement du signal audio pour placer la parole au cœur d’une nouvelle expérience de communication main-libre et flexible qui exploitera la multitude d’appareils équipés de microphones présents dans notre vie quotidienne (composant une antenne acoustique hétérogène). Je propose d'appliquer les techniques de l'apprentissage profond (deep learning) pour résoudre les problèmes liés à l'exploitation de ces antennes hétérogènes. En particulier, je propose de reformuler le problème de la synchronisation entre appareils au niveau signal comme un problème d’apprentissage multivues visant à extraire des informations complémentaires depuis chaque appareil disponible. Je propose également d’explorer des méthodes inspirées de la distillation ou l'adaptation du savoir (knowledge distillation et knowledge adaptation) pour pallier le problème de l’annotation des données et pouvoir apprendre des modèles acoustiques robustes au bruit directement à partir de signaux multicanaux. Les approches proposées durant DiSCogs seront évaluées sur la plateforme « appartement intelligent » du Loria.
Coordination du projet
Romain SERIZEL (Laboratoire lorrain de recherche en informatique et ses applications)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
LORIA Laboratoire lorrain de recherche en informatique et ses applications
Aide de l'ANR 284 853 euros
Début et durée du projet scientifique :
août 2018
- 42 Mois