– OUISPER
OUISPER, une interface silencieuse pour la parole (Note : Les allocations étant limitées aux équipes résidant en France, dans la saisie en ligne, le partenaire 3 a été supprimé car il aurait été impossible de valider le projet sinon. Les participations des membres permanents du VTV ont été inclus, pour le calcul du coût complet, avec les coûts du partenaire I. ) OUISPER vise à réaliser un prototype de dispositif destiné, à terme, à être léger et portatif pour reconstituer un signal de parole intelligible, en temps réel, par concaténation à partir de paramètres articulatoires, obtenus par la saisie des mouvements de la langue et des lèvres du locuteur par imagerie ultrasonore et optique, sans activation des cordes vocales. Le système utilise l'apprentissage automatique pour associer les images ultrasonores (langue) et optiques (lèvres) et une représentation phonétique (ALISP, voir section suivante) qui permet de reconstituer le signal de parole en temps réel. Les ultrasons, et, plus récemment, l'IRM (imagerie par résonance magnétique) et la cinéradiographie (rayons-X), sont, bien entendu, utilisés depuis plusieurs années dans l'étude du conduit vocal, souvent pour l'élaboration de synthétiseurs articulatoires de parole de type talking head [methods]. La combinaison de différents types de capteurs en traitement de la parole, appelée approche «multimodale», est également une pratique courante aujourd'hui [multimodal]. L'originalité de OUISPER réside, non pas dans la synthèse articulatoire de la parole, mais dans les nouvelles applications que notre dispositif ouvrira - dans le domaine des télécommunications o téléphone portable silencieux à utiliser en réunion, dans le train, au cinéma, etc.. o système silencieux de saisie de données o dispositif de sécurité pour des situations militaires ou policières, d'urgence, etc., - dans le domaine de la médecine : o un « larynx intelligent » pour des patients ayant subi une opération de l'appareil vocal. o une alternative aux électrolarynxs conventionnels qui ne sont en réalité que de simples vibreurs o une alternative à la technique chirurgicale de voix trachéo-oesophagéale (VTO) On remarque que l'IRM et la cinéradiographie, en dépit de leur meilleure résolution spatiale, ne sont pas applicables dans le cas de OUISPER, pour des raisons de dose radiologique et de portabilité. Des résultats préliminaires, mais probants, sur une base de 2 minutes de parole, ont déjà été obtenus avec l'approche OUISPER ; ils ont été publiés dans des conférences de l'IEEE par quatre des membres de la présente collaboration [ouisper]. Une base beaucoup plus importante, d'une heure de parole, a récemment été constituée ; elle est actuellement en cours de validation par l'ensemble des 3 laboratoires participant au projet. Cette nouvelle base sera le point de départ du projet OUISPER. Comme les applications visées par OUISPER touchent au secteur de la téléphonie mobile, ainsi qu'à une intervention chirurgicale assez courante, les enjeux commerciaux d'une percée dans ce domaine seront probablement très significatifs. On trouve dans la littérature des approches dont les objectifs sont semblables aux nôtres ; elles mettent en œuvre la lecture automatique des lèvres, ou une technique d'imagerie de la langue dans une interface homme-machine [similar]. Néanmoins, à l'heure actuelle, la seule technique véritablement en concurrence avec OUISPER est un système fondé sur l'électromyographie, encore embryonnaire, développé par la NASA Ames Lab aux Etats Unis [electromyo]. Le caractère pluridisciplinaire de nos équipes devrait lui permettre de réaliser une percée décisive sur ce créneau novateur. Originalité et caractère ambitieux L'originalité de OUISPER réside, non pas dans la synthèse articulatoire de la parole, mais dans les nouvelles applications que notre dispositif ouvrira. Si des résultats préliminaire prometteurs ont déjà été obtenus (voir liste de publications) avec la technique OUISPER, l...
Coordination du projet
Bruce DENBY (Organisme de recherche)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
CNRS DELEGATION REGIONALE PARIS A
Aide de l'ANR 206 400 euros
Début et durée du projet scientifique :
- 36 Mois