FRAL - Appel Franco-allemand en sciences humaines et sociales

Prédicats complexes dans les langues : émergence, typologie, évolution – COMPLETE

ComPLETE

Complex Predicates in Languages: Emergence, Typology, Evolution

Objectifs

Bien que le terme de «prédicats complexes» soit bien établi en linguistique, il reste un défi théorique. Les prédicats complexes sont généralement définis comme des séquences de mots phonologiquement indépendants, se comportant ensemble comme un prédicat unique; mais cette définition couvre un large éventail de constructions dont les limites sont peu claires. C’est pourquoi nous nous concentrons sur les prédicats complexes à base verbale, définis comme des constructions grammaticales servant de prédicat à un seul sujet, impliquant au moins deux lexèmes appartenant, synchroniquement ou diachroniquement, à la classe des verbes. Cette définition inclut verbes sériels, converbes, verbes légers et auxiliaires: ceux-ci partagent certaines propriétés fonctionnelles et suivent parfois des dynamiques historiques parallèles. Le projet ComPLETE vise à réaliser une analyse systématique des prédicats complexes sur des bases formelles et sémantiques, du point de vue synchronique, diachronique et aréal.<br />Les données disponibles étant limitées à certaines familles linguistiques et zones géographiques, ComPLETE fondera ses analyses sur un large éventail de familles linguistiques, en fonction de l’expertise des participants. Le projet développera d’abord un questionnaire typologique pour garantir la comparabilité interlinguistique. Sur la base des réponses fournies par les linguistes experts, trois questions de recherche seront abordées: (1) Pouvons-nous identifier des dépendances entre les domaines sémantiques associés aux prédicats complexes (par exemple, aspect-temps-modalité, orientation spatiale) et des propriétés formelles spécifiques? (2) Comment modéliser l'évolution diachronique de ces structures, en termes de grammaticalisation et de lexicalisation? (3) Comment les prédicats complexes sont-ils répartis dans les aires linguistiques ou les familles de langues?<br />Le noyau des équipes française et allemande est composé de quatre linguistes ayant une longue expérience en linguistique de terrain, en comparaison des langues et en typologie. Chaque pays recrutera un doctorant et un post-doctorant: en Allemagne, le post-doctorant (50%) sera responsable de la coordination; en France, il fera une synthèse sur un domaine linguistique et apportera une expertise en statistique. Ensemble, ils collaboreront avec des ingénieurs en informatique pour créer une base de données.<br />L'équipe ComPLETE recevra également les contributions de 14 participants et de 14 partenaires externes - des linguistes ayant une expertise sur de nombreuses familles linguistiques et sur un large éventail de questions théoriques. Au bout de trois ans, le projet ComPLETE publiera un volume collectif, incluant une introduction théorique et des chapitres rédigés par tous les contributeurs. Notre base de données et nos analyses seront accessibles en ligne via la plate-forme open source Cross-Linguistic Linked Data.

1. Création d’un questionnaire typologique
Un questionnaire typologique sera élaboré par les quatre responsables du projet, avec l'aide des post-docs, docs et participants, et rempli par tous les membres du consortium. Son élaboration nécessitera une vérification préliminaire approfondie des données par le biais d'échanges entre les responsables du projet et avec les participants et les partenaires.
L'unité primaire d'observation du questionnaire sera les constructions individuelles dans les différentes langues concernant les aspects sémantiques, morphosyntaxiques et lexicaux qui seront développés dans le questionnaire et discutés avec les autres participants au projet.
2. Base de données en ligne et analyses statistiques
Les personnes recrutées dans le cadre du projet (postdocs, doctorants) contribueront à la création d'une base de données en ligne sur les VPC, en étroite collaboration avec nos ingénieurs ; ils l'alimenteront avec leurs propres données, qu'elles soient de première ou de seconde main. Une fois cette base de données mise en place et testée, des experts linguistiques la rempliront avec leurs propres données.
Cette base de données sera à son tour exploitée pour des généralisations typologiques et des analyses statistiques :
› Afin de vérifier dans quelle mesure les quatre types de prédicats complexes forment des «classes naturelles«, nous utiliserons NeighborNet pour calculer une matrice de distance montrant le regroupement des constructions et de leurs propriétés morphosyntaxiques.
› La taxonomie typologiquement informée du verbe lexical et la confirmation indépendante des généralisations typologiques peuvent commencer par des regroupements dans NeighborNet, suivis par d'autres méthodes actuellement utilisées par Bisang & Malchukov dans leur projet de grammaticalisation (par exemple les analyses de corrélation, de regroupement hiérarchique, et en forêts aléatoires). La décision finale sur ces méthodes ne pourra être prise qu'en 3ème année sur la base de nos données, en coopération avec le post-doctorant français.
› Les études sur la grammaticalisation et la lexicalisation seront basées sur une liste de verbes grammaticaux (grammaticalisation) et de domaines lexicaux, extraits du questionnaire.
› Les questions relatives aux biais aréolaires et phylogénétiques seront visualisées en plaçant les résultats de la section précédente sur des cartes de type WALS (Haspelmath et al. 2005 ; Dryer & Haspelmath 2013).

Pendant les dix-huit premiers mois du projet, l’équipe a réalisé tous les objectifs prévus dans les temps prévus.
Les porteurs du projet (PI), avec la participation des doctorants et post-doctorants recrutés, ont mis au point, au cours de réunions en distanciel, un questionnaire typologique sur les prédicats complexes verbaux reprenant les points théoriques qui nous intéressent pour chaque construction fournie. Celui-ci a été soumis et discuté avec l’ensemble des participants au projet lors de la conférence de démarrage qui s’est déroulée à l’Université de Mayence du 14 au 16 novembre 2022. Il a ensuite été amendé sur la base de ces discussions au cours de réunions en distanciel entre les PI, doctorants et post-doctorants, et distribué à tous les participants en avril 2023. Ce questionnaire a servi de base aux deux PI pour la rédaction de deux chapitres-modèles qui ont été distribués aux participants en août 2023. Ensemble, ils doivent servir de guide aux participants pour la rédaction de leurs articles dans l’ouvrage collectif prévu pour la fin du projet.
La conférence de novembre 2022 a en outre permis à 25 participants de présenter et discuter une première analyse des prédicats complexe verbaux dans leur(s) langue(s) de spécialité, de discuter de deux problèmes théoriques sur la question (la hiérarchie des relations inter-clausales et les concepts comparatifs en typologie) avec les experts du projet, et de présenter et discuter la maquette de la base de données.
Le questionnaire a été converti en une interface web (HTML/Javascript) utilisant une base de données MySQL. Le langage de programmation est Python combiné avec Flask Framework, WTForms, Blueprints et Jinja2 Templating. La BDD est en phase terminale de tests et pourra être ouverte à tous les participants comme prévu au début de 2024. L’interface web permet d’entrer une nouvelle langue, des constructions, des exemples, des chemins de grammaticalisation et de lexicalisation et d’en suggérer de nouveaux, et de vérifier et modifier toutes les données. Lors de l'ajout d'une nouvelle construction, des sélections conditionnelles sont possibles. La base de données ComPLETE est accompagnée d'un manuel détaillé (discuté ensemble et rédigé par un post-doc) contenant des exemples et des instructions sur la manière de répondre à chaque question (Figure ci-dessous).

Les articles des participants seront soumis aux PI entre le 1er décembre 2023 et le 1er février 2024 et feront d’abord l’objet d’une relecture interne par les PI au cours du 1er semestre 2024. En 2024, tous les participants pourront remplir la BDD.
Dans la seconde moitié de 2024, les PIs, docs et post-docs travaillent sur l'évaluation quantitative de la base de données ; le post-doctorant français sélectionne et commence à utiliser les méthodes d'analyse statistique appropriées.
La seconde conférence avec environ 30 participants et partenaires aura lieu début 2025. Il sera demandé à tous de soumettre leur chapitre avant de participer à la conférence. L'équipe centrale rédigera l’article théorique et de synthèse des résultats.
En 2025, le Manuel sur les prédicats complexes verbaux est soumis. Le travail sur la base de données est achevé ; la base de données en ligne est rendue publique.
En plus des livrables et jalons prévus mentionnés en B, les doctorants et post-doctorants du projet ont soumis un projet d’atelier sur les prédicats complexes pour la conférence SLE qui se tiendra à Helsinki du 21 au 24 août 2024 (https://societaslinguistica.eu/sle2024/wp-content/uploads/sites/6/2023/10/Exploring-the-Limits-of-Complex-Predicates-1.pdf). S’il est accepté, 21 résumés ont déjà été reçus.

- Questionnaire typologique «prédicats complexes verbaux«
- Base de données typologique «prédicats complexes verbaux«
- Chapitres d’ouvrages
Malchukov, Andrej and Patryk Czerwinski (in press). Complex predicates in North Asian languages. In: Edward Vajda (ed.) The Languages and Linguistics of Northern Asia, WOL Vol. 10, Berlin: Mouton de Gruyter, 1065-1119. doi.org/10.1515/9783110556216-019
- Communications dans des colloques
25 présentations à la Conference of the ComPLETE project, University of Mainz. November 14-16, 2022 par Aplonova, Ekaterina ; Bisang, Walter, Alexandre François, Andrej Malchukov, Martine Vanhove, Uyên-To Doan-Rabier & Frédérique Mélanie. 2022; Boyeldieu, Pascal; Butt, Miriam; Creissels, Dennis; Czerwinski, Patryk; Fedden, Sebastian; Forker, Diana; François, Alexandre; Güldemann, Tom & Lee Pratchett; Haig, Geoffrey; Haspelmath, Martin; Helmbrecht, Johannes ; Inman, David; Jacques, Guillaume; Malchukov Andrej & Patryk Czerwinski; Meyer, Ronny; Moyse-Faurie, Claire; Robert, Stéphane; Skribnik, Elena; Souag, Lameen; Treis, Yvonne; Van Valin, Robert; Vuillermet, Marine; Mithun, Marianne.
Aplonova, Ekaterina. 2023. Serial verb constructions in Ginyanga (Kwa): towards a corpus study. CALL-52, University of Leiden. August 28-30, 2023.
Krauße, Daniel. 2023. Coverbs, Converbs and Serial Verbs: Differences and Similarities. Invited talk at the Linguistic Colloquium at Mainz University, Germany.
Bisang, Walter. Oct 2023.The two components of discourse grammar and cross-linguistic variation, a comparison of converb constructions, switch-reference constructions and serial verb constructions in discourse. Invited speaker at Workshop on “Discourse grammar and complementation” at Sun Yat-sen University, Guangzhou, PR China.
Krauße, Daniel. 2023. Non-contiguous complex predicates: A view from Wagiman. 2n? FEMIDAL workshop (Formal & Experimental Methods and In-depth Description of Australian Indigenous Languages) in Fontainebleau, France.
- Présentations à des séminaires
François, Alexandre. 2023. Predicados complexos e estrutura argumental em Vanuatu. Séance du séminaire “Descrição, Tipologia e Linguística Histórica: entre a Melanésia e a Amazônia” (niveau master, doctorat, post-doctorat), à l’invitation du Programa de Pós-Graduação em Linguística, Universidade de Brasília, Brésil.
Vanhove, Martine. 2023. Auxiliaries in Beja. Séminaire du LLACAN, 14/02/2023
Krauße, Daniel. 2023. The ComPLETE database of complex predicates: A view from Melanesia. Invited talk at the Séminaire du Lattice in Montrouge, France.
- Actions de diffusion
Aplonova, Ekaterina & Pozdniakova, Viktoria. 2023. A narrative corpus of Ginyanga. In Nikitina, Tatiana, Ekaterina Aplonova, Izabela Jordanoska, Ekaterina Biteeva, Abbie Hantgan-Sonko, Guillaume Guitang, Olga Kuznetsova, Rebecca Paterson, Elena Perekhvalskaya & Lacina Silué (eds.) The SpeechReporting Corpus: Discourse Reporting in Storytelling. CNRS-LLACAN & LACITO, discoursereporting.huma-num.fr

Bien que le terme de «prédicats complexes» soit bien établi en linguistique, il reste un défi théorique. Les prédicats complexes sont généralement définis comme des séquences de mots phonologiquement indépendants, se comportant ensemble comme un prédicat unique; mais cette définition couvre un large éventail de constructions dont les limites sont peu claires. C’est pourquoi nous nous concentrons sur les prédicats complexes à base verbale, définis comme des constructions grammaticales servant de prédicat à un seul sujet, impliquant au moins deux lexèmes appartenant, synchroniquement ou diachroniquement, à la classe des verbes. Cette définition inclut verbes sériels, converbes, verbes légers et auxiliaires: ceux-ci partagent certaines propriétés fonctionnelles et suivent parfois des dynamiques historiques parallèles. Le projet ComPLETE vise à réaliser une analyse systématique des prédicats complexes sur des bases formelles et sémantiques, du point de vue synchronique, diachronique et aréal.
Les données disponibles étant limitées à certaines familles linguistiques et zones géographiques, ComPLETE fondera ses analyses sur un large éventail de familles linguistiques, en fonction de l’expertise des participants. Le projet développera d’abord un questionnaire typologique pour garantir la comparabilité interlinguistique. Sur la base des réponses fournies par les linguistes experts, trois questions de recherche seront abordées: (1) Pouvons-nous identifier des dépendances entre les domaines sémantiques associés aux prédicats complexes (par exemple, aspect-temps-modalité, orientation spatiale) et des propriétés formelles spécifiques? (2) Comment modéliser l'évolution diachronique de ces structures, en termes de grammaticalisation et de lexicalisation? (3) Comment les prédicats complexes sont-ils répartis dans les aires linguistiques ou les familles de langues?
Le noyau des équipes française et allemande est composé de quatre linguistes ayant une longue expérience en linguistique de terrain, en comparaison des langues et en typologie. Chaque pays recrutera un doctorant et un post-doctorant: en Allemagne, le post-doctorant (50%) sera responsable de la coordination; en France, il fera une synthèse sur un domaine linguistique et apportera une expertise en statistique. Ensemble, ils collaboreront avec des ingénieurs en informatique pour créer une base de données.
L'équipe ComPLETE recevra également les contributions de 14 participants et de 14 partenaires externes - des linguistes ayant une expertise sur de nombreuses familles linguistiques et sur un large éventail de questions théoriques. Au bout de trois ans, le projet ComPLETE publiera un volume collectif, incluant une introduction théorique et des chapitres rédigés par tous les contributeurs. Notre base de données et nos analyses seront accessibles en ligne via la plate-forme open source Cross-Linguistic Linked Data.

Coordination du projet

Martine Vanhove (Langage, langues et cultures d'Afrique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LLACAN Langage, langues et cultures d'Afrique
University of Mainz
LATTICE Langues, textes, traitements informatiques, cognition

Aide de l'ANR 580 182 euros
Début et durée du projet scientifique : avril 2022 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter