DS07 - Société de l'information et de la communication

Antennes acoustiques hétérogènes et non contraintes pour la communication parlée – DiSCogs

Résumé de soumission

DiSCogs vise à résoudre certains problèmes fondamentaux de traitement du signal audio pour placer la parole au cœur d’une nouvelle expérience de communication main-libre et flexible qui exploitera la multitude d’appareils équipés de microphones présents dans notre vie quotidienne (composant une antenne acoustique hétérogène). Je propose d'appliquer les techniques de l'apprentissage profond (deep learning) pour résoudre les problèmes liés à l'exploitation de ces antennes hétérogènes. En particulier, je propose de reformuler le problème de la synchronisation entre appareils au niveau signal comme un problème d’apprentissage multivues visant à extraire des informations complémentaires depuis chaque appareil disponible. Je propose également d’explorer des méthodes inspirées de la distillation ou l'adaptation du savoir (knowledge distillation et knowledge adaptation) pour pallier le problème de l’annotation des données et pouvoir apprendre des modèles acoustiques robustes au bruit directement à partir de signaux multicanaux. Les approches proposées durant DiSCogs seront évaluées sur la plateforme « appartement intelligent » du Loria.

Coordination du projet

Romain SERIZEL (Laboratoire lorrain de recherche en informatique et ses applications)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LORIA Laboratoire lorrain de recherche en informatique et ses applications

Aide de l'ANR 284 853 euros
Début et durée du projet scientifique : août 2018 - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter