– PI
L?informatique est désormais un instrument pour écrire et communiquer. Traitements de textes, courriers électroniques, voire des systèmes plus avancés comme la dictée ou la synthèse vocale sont des outils largement répandus. La possibilité d?offrir ou pas ces services pour une langue donnée peut permettre de définir son « niveau d?informatisation ». Cependant, pour la plupart des langues du monde, les services liés au traitement de l?oral, notamment la reconnaissance automatique de la parole, sont inexistants. De nos jours, presque toutes les technologies vocales, en particulier les systèmes de reconnaissance automatique de la parole (RAP), emploient des approches statistiques. Cependant, étant donné la nature statistique de ces méthodes, une grande quantité de ressources (vocabulaires, corpus des textes, corpus transcrits de parole, dictionnaires phonétiques) est requise pour construire les modèles associés à ces systèmes (modèles acoustiques, modèles de langage,?). Ces ressources cruciales ne sont pas directement disponibles pour des langues peu dotées (également appelées langues-?). Ainsi, une méthodologie pour construire rapidement de telles ressources est nécessaire, ainsi que des stratégies efficaces permettant d?exploiter des ressources limitées. D'un point de vue scientifique, l'intérêt et l'originalité de ce projet consiste à proposer des méthodes innovantes qui vont bien au delà du simple ré-apprentissage des modèles acoustiques et de langage. Ainsi, une rupture significative est nécessaire pour développer des systèmes de reconnaissance pour les langues peu dotées. Par exemple nous projetons de remettre en cause l'utilisation du mot comme unité fondamentale pour la modélisation du langage : des modèles de plus faible complexité pourraient par exemple être obtenus en employant des unités sous-lexicales (morphèmes, syllabes ou même caractères) qui pourraient être intéressantes quand peu de données sont disponibles. Dans cet objectif, la possibilité d?extraire de telles unités de façon non supervisée limiterait l'expertise humaine. En ce qui concerne la modélisation acoustique, l'originalité de ce projet est dans la proposition de modèles multilingues à large couverture basés sur notre connaissance des systèmes phonologiques des langues du monde. Enfin, la construction de systèmes de reconnaissance automatique de la parole plus indépendants de la langue est également très ambitieuse et pourrait être abordée par l?élaboration de techniques d?adaptation non supervisée appliquées sur des modèles acoustiques multilingues. D'un point de vue opérationnel, ce projet vise à fournir un kit de développement de systèmes de RAP pour les langues-?. Cet objectif est réaliste puisque certains des éléments nécessaires existent déjà dans une forme préliminaire chez les partenaires de ce consortium : outils de collecte et filtrage de données textuelles (LIG, LIA), outils de modélisation acoustique et décodeur pour la RAP (LIA), outils de mapping phonétique pour amorcer un modèle acoustique dans une nouvelle langue (LIG). Nous projetons de distribuer et d?évaluer un tel kit de développement (et valider par conséquent notre méthodologie) en déployant notre méthodologie sur de nouvelles langues peu dotées (khmer et lao par exemple). L'objectif final est de faciliter la création d'une communauté d'utilisateurs de plusieurs pays qui développeraient des systèmes de reconnaissance ou traduction de parole pour leur propre langue. Au niveau des retombées sociales, une telle méthodologie, si elle est validée comme nous l?espérons, pourrait être utilisée pour un grand nombre d?autres langues peu-dotées : soit pour des langues officielles de pays en voie de développement comme le Cambodge où il n?existe que peu d?experts pour réaliser ce travail d?informatisation, soit aussi pour des dialectes. Pour ces derniers (dont certains sont essentiellement parlés et peu écrits), l?intérêt immédiat est de participer à leur sauvegarde en se donnant la possibilité dans l?avenir de proposer des outils permettant leur transcription et/ou traduction à des fins par exemple d?archivage et de conservation. Il est également important de noter que certaines langues pourraient présenter, à l'avenir, un potentiel économique fort : le bengalais, le malais et le vietnamien sont par exemple dans le top-20 des langues les plus parlées au monde. Quelques autres langues peu dotées pourraient être aussi d?un grand intérêt pour des projets gouvernementaux ou non gouvernementaux impliquant la sécurité globale ou les questions humanitaires.
Coordination du projet
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Aide de l'ANR 361 518 euros
Début et durée du projet scientifique :
- 0 Mois