MDCA - Programme "Masse de Données - Connaissances Ambiantes" 2006

Exploration de masse de documents audio pour l'extraction et le traitement de la parole conversationnelle – EPAC

Résumé de soumission

Contexte et motivation 1. Contexte et motivation Le projet EPAC concerne le traitement de données audio non structurées. Il met en scène quatre laboratoires académiques : IRIT (Toulouse), LI (Tours), LIA (Avignon), LIUM (Le Mans). Le projet EPAC a pour but de proposer des méthodes d'extraction d'information et de structuration de documents spécifiques aux données audio, prenant en compte l'ensemble des canaux d'information : segmentation du signal (parole/musique/jingle/...), identification et suivi du locuteur, transcription de parole, détection et suivi de thème, détection d'émotion, analyse du discours, interactions conversationnelles, etc. Ces tâches de traitement du signal et de la parole sont en grande partie maîtrisées par les différents partenaires du projet dont la plupart ont participé à la campagne d'évaluation TECHNOLANGUE/EVALDA/ESTER. Dans ce cadre de cette campagne et grâce à la participation de l'IRIT au projet RAIVES (Automatic Retrieval of Audio & Speech Informations, projet CNRS, 2002-2003) nous disposons d'une base d'environ 2000 heures d'émissions radiophoniques francophones (1800 heures provenant d'ESTER, dont l00h manuellement annotées, et 130h venant de RAIVES, dont une grosse dizaine d'heures manuellement annotées, soit 1930 heures en tout, dont 100h manuellement annotés). En particulier, le projet EPAC mettra l'accent sur le traitement de la parole conversationnelle. Parmi les émissions d'information radiophoniques ou télévisuelles, la parole conversationnelle est souvent marginale : des techniques de détection et d'extraction de la parole conversationnelle seront proposées et développées. Le projet mettra en place des méthodes de traitement de ce type de parole en proposant des descripteurs pertinents et en développant les outils nécessaires à leur exploitation. Cette partie sera l'objet d'une collaboration entre chercheurs en linguistique (LI, LIUM) et chercheurs en traitement automatique de la parole (IRIT, LIA, LIUM). Enfin, un cadre d'évaluation commun aux différents acteurs du projet sera mis en place pour chacune des tâches étudiées. Cette évaluation portera sur une partie des 2000 heures d'émissions radiophoniques disponibles, contribuant ainsi à la valorisation de ces données. 2. Retombées scientifiques et techniques attendues Résultats attendus Les résultats du projet seront validés de trois façons différentes : Evaluation interne de chaque sous-projet en suivant les règles des campagnes d'évaluation ESTER ou NIST. Evaluation au travers de la participation à des campagnes d'évaluations nationales et internationales du domaine, de type ESTER ou NIST. Articles scientifiques, publications scientifiques et rapports techniques relatifs aux sujets étudiés dans le projet. De plus, les résultats partiels des évaluations annuelles internes seront publiés sur le site web du projet EPAC. Conséquences attendues Les conséquences attendues sont diverses: Disponibilité sous licence libre des outils développés durant le projet, spécialisés dans le traitement de la parole conversationnelle. Fourniture d'un nouveau corpus de transcriptions annotées manuellement de 100 heures d'émissions radiophoniques, principalement sur des enregistrements de parole conversationnelle. Fourniture d'un corpus de transcriptions annotées automatiquement de plus de 1700 heures d'émissions radiophoniques. Ce corpus contiendra plusieurs sorties de systèmes de transcription automatique (le système SPEERAL du LIA et le système du LIUM). De plus, chaque mot reconnu sera associé à une mesure de confiance. Impulsion dans la communauté 'Parole' francophone par la mise à disposition de nouvelles données et de nouveaux outils. Développement d'interactions entre la communauté de recherche en linguistique et la communauté 'traitement automatique de la parole'.

Coordination du projet

Université

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

Aide de l'ANR 358 494 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter