Corpus occitan numérisé de textes anciens et modernes – CONTAM
Le projet CONTAM propose d’établir un corpus numérique de textes occitans aussi exhaustif que possible, allant du XVIe siècle à la période précédant la “deuxième renaissance occitane” du XIXe siècle afin d’établir la continuité entre l’époque médiévale, pour laquelle des textes déjà numérisés et partiellement exploitables existent, et l’époque contemporaine couverte par la base textuelle BaTelÒC (CLLE, UMR 5263) et combler ainsi le manque flagrant de ressources exploitables à l’aide des outils numériques actuels. La constitution du corpus, première étape du projet, est un préalable à la réalisation de l’annotation et de la lemmatisation de l’ensemble des textes collectés et encodés en TEI. Bien que riche d’une production écrite littéraire et pragmatique millénaire et reconnue « discipline rare », la langue occitane reste à ce jour une langue d’Europe encore peu dotée en instruments scientifiques d’étude du lexique, de la grammaire et de la syntaxe, en particulier pour la période couverte par ce nouveau corpus. La mise en place de CONTAM représentera une avancée importante pour la sauvegarde et la valorisation du patrimoine linguistique occitan. Dans un domaine où il convient de favoriser le contact entre les projets, l’échange de données et l'interopérabilité des différents modules, le projet CONTAM vise ainsi à l’interconnexion des ressources numériques déjà existantes pour l’occitan, entre autres BaTeLÒc pour les usages contemporains de l’occitan, le THESOC pour l’étude diatopique de la variation lexicale. Il sera ainsi possible d’évaluer la continuité du lexique, de la syntaxe ou de la morphologie de l’occitan du Moyen Âge à nos jours, d’un point de vue diachronique et diatopique.
Coordination du projet
Hervé Lieutard (UNIVERSITÉ DE MONTPELLIER PAUL VALERY (EPE))
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
RESO UNIVERSITÉ DE MONTPELLIER PAUL VALERY (EPE)
BCL UNIVERSITÉ CÔTE D'AZUR
GIPSA-lab Grenoble Images Parole Signal Automatique
EA4509 SORBONNE UNIVERSITÉ
Aide de l'ANR 616 275 euros
Début et durée du projet scientifique :
septembre 2025
- 60 Mois