Blanc SHS 2 - Sciences humaines et sociales : Développement humain et cognition, langage et communication

Lexiques d’Afrique : corpus de référence, études quantitatives – RefLex

Résumé de soumission

Le projet RefLex a pour but de tester un ensemble d’hypothèses fondamentales sur la structure et l’évolution des langues d’Afrique qui sont souvent répétées dans la littérature, mais dont la validité n’a jamais pu être démontrée de façon concrète. Ces hypothèses ont en commun qu’elles ne peuvent être testées que par une approche quantitative, qui quant à elle suppose l’existence d’une documentation assez complète. Les quelque 2200 langues africaines offrent une grande diversité typologique, avec cependant quelques caractères particuliers qui transcendent les familles linguistiques comme les zones géographiques, et ceci pour chaque niveau d'analyse. Ces caractères – on peut citer comme exemples les pronoms logophoriques où l'articulation labiovélaire – n'ont jamais pu faire l'objet d'études systématiques en raison principalement du manque de données accessibles pour la majorité des langues africaines. RefLex résout ce problème grâce à l’exploitation systématique de la documentation lexicale existante qui est en fait beaucoup plus importante que la documentation grammaticale et malgré cela souvent ignorée dans les études typologiques. L’un des buts de RefLex est de rendre accessible aux chercheurs intéressés la documentation dispersée et difficile d'accès. En effet, le corpus lexical des langues africaines qui sera accessible en ligne à l’ensemble de la communauté scientifique au terme du projet fournira un accès immédiat à un volume de données considérable (au moins 2 millions d'entrées lexicales à l'issue du projet, pour plus de 1000 langues). Cette documentation permettra des avancées spectaculaires dans divers domaines : typologie, phylogénie, sémantique lexicale, diffusion lexicale, linguistique aréale. Il s'agira de la plus grosse base de données comparative en ligne au monde. Par ailleurs, cet outil se distinguera des réalisations comparables sur deux points cruciaux : i) l'accès en ligne aux sources originales dont sont issues les données numériques, ce qui fait de ce corpus un véritable corpus de référence, rendant possible corrections, vérifications, échanges argumentés, reproductions ou éventuelles falsifications ; ii) la présence d'une véritable bibliothèque d'outils pour l'exploitation scientifique des données qui seront en outre standardisées pour faciliter les recherches et comparaisons, et qui est appelée à être enrichie par les utilisateurs du projet.
Le projet RefLex s’inscrit donc dans le domaine émergent de l’approche quantitative des questions linguistiques complexes. Il représente l’un des très rares projets de ce type basés sur des données provenant de langues diverses et le seul à permettre d’effectuer facilement des manipulations sur les données.
Ce projet, où collaborent des membres des laboratoires LLACAN et DDL du CNRS, réunit une vingtaine de participants, spécialistes reconnus de plusieurs familles linguistiques d’Afrique, comparatistes et typologues.

Coordination du projet

SEGERER Guillaume (Langage, Langues et Cultures d'Afrique Noire) – segerer@vjf.cnrs.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

DDL CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE RHONE-AUVERGNE
LLACAN Langage, Langues et Cultures d'Afrique Noire

Aide de l'ANR 250 000 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter