Application "La langue du pays" – YAR - Yezh Ar vRo
La recherche pilote que constitue le projet YAR est une collaboration entre acteurs de la société civile et chercheur·euses en linguistique et informatique (traitement automatique des langues, ergonomie) dans le cadre du développement de technologies œuvrant à la préservation linguistique. Elle s’inscrit en Bretagne, et se construit avec les locuteurs, locutrices et acteurs de la préservation d’une langue celtique en très grave danger d’extinction d'après l’UNESCO?: le breton. L’association Dastum (collecte sauvegarde et diffusion du patrimoine oral breton depuis 1972) et le pôle scientifique (CNRS et trois universités) mobilisent trois associations d’enseignant·es et se coordonnent avec le soutien du fond de dotation Bretagne Numérique.
YAR comprend la mise à disposition (i) d'une application smartphone de collecte de la parole géolocalisée pour le grand public, (ii) d'une plateforme web de transcription participative intégrant le son et le texte, utilisable en contexte pédagogique. Le matériel sonore collecté alimentera la plateforme de transcription participative conçue avec et pour le pôle pédagogique. Le corpus oral transcrit soutiendra le développement et le perfectionnement de la reconnaissance vocale automatisée (ASR) pour le breton.
Les actions de préservation de la diversité linguistique par le déploiement d’outils de traitement automatique des langues dépendent de leur appropriation réelle par les communautés parlantes. Notre hypothèse de recherche fondamentale est que cette appropriation collective dépend de l’implication précoce des usagers (locuteurs, apprenants et enseignants) dans la conception de ces technologies. L’écosystème breton fournit un contexte de test adapté pour notre hypothèse. Les solutions techniques envisagées rencontrent des besoins exprimés par la société civile : manque de supports pédagogiques incluant du son ; manque de corpus sonore transcrit empêchant le développement d’outils de reconnaissance vocale pour le repérage (titrage, indexation) de fonds sonores existants, le sous-titrage automatique de productions audio-visuelles, ou la dictée de messages SMS ; difficulté enfin des apprenants à se socialiser dans la langue. La fonction de géolocalisation est adaptée au contexte (inscription rurale dans le territoire, flux démographiques saisonniers ou permanents) et apporte un support de lien et d’échanges mobilisateur pour des publics variés présents dans l’écosystème.
Les logiciels développés sont open source et sont destinés à servir la collecte augmentée dans toute autre langue, minorisée ou pas.
Coordination du projet
Mélanie Jouitteau (CENTRE DE RECHERCHE SUR LA LANGUE ET LES TEXTES BASQUES)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
IKER CENTRE DE RECHERCHE SUR LA LANGUE ET LES TEXTES BASQUES
Dastum
Bretagne Numérique
Aide de l'ANR 99 993 euros
Début et durée du projet scientifique :
- 18 Mois