CE54 - Arts, langues, littératures, philosophies 2025

Corpus occitan numérisé de textes anciens et modernes – CONTAM

Résumé de soumission

Le projet CONTAM propose d’établir un corpus numérique de textes occitans aussi exhaustif que possible, allant du XVIe siècle à la période précédant la “deuxième renaissance occitane” du XIXe siècle afin d’établir la continuité entre l’époque médiévale, pour laquelle des textes déjà numérisés et partiellement exploitables existent, et l’époque contemporaine couverte par la base textuelle BaTelÒC (CLLE, UMR 5263) et combler ainsi le manque flagrant de ressources exploitables à l’aide des outils numériques actuels. La constitution du corpus, première étape du projet, est un préalable à la réalisation de l’annotation et de la lemmatisation de l’ensemble des textes collectés et encodés en TEI. Bien que riche d’une production écrite littéraire et pragmatique millénaire et reconnue « discipline rare », la langue occitane reste à ce jour une langue d’Europe encore peu dotée en instruments scientifiques d’étude du lexique, de la grammaire et de la syntaxe, en particulier pour la période couverte par ce nouveau corpus. La mise en place de CONTAM représentera une avancée importante pour la sauvegarde et la valorisation du patrimoine linguistique occitan. Dans un domaine où il convient de favoriser le contact entre les projets, l’échange de données et l'interopérabilité des différents modules, le projet CONTAM vise ainsi à l’interconnexion des ressources numériques déjà existantes pour l’occitan, entre autres BaTeLÒc pour les usages contemporains de l’occitan, le THESOC pour l’étude diatopique de la variation lexicale. Il sera ainsi possible d’évaluer la continuité du lexique, de la syntaxe ou de la morphologie de l’occitan du Moyen Âge à nos jours, d’un point de vue diachronique et diatopique.

Coordination du projet

Hervé Lieutard (UNIVERSITÉ DE MONTPELLIER PAUL VALERY (EPE))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

RESO UNIVERSITÉ DE MONTPELLIER PAUL VALERY (EPE)
BCL UNIVERSITÉ CÔTE D'AZUR
GIPSA-lab Grenoble Images Parole Signal Automatique
EA4509 SORBONNE UNIVERSITÉ

Aide de l'ANR 616 275 euros
Début et durée du projet scientifique : septembre 2025 - 60 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter