FRAL - Programme franco-allemand en SHS

L’évolution du système prépositionnel du français – PRESTO

L’évolution du système prépositionnel du français : approche diachronique et quantitative

Etude diachronique de l’emploi, des valeurs sémantiques et discursives de prépositions simples du français de l’ancienne langue (IXè s.) jusqu’au français contemporain.

Parvenir à une vision innovatrice du devenir historique des prépositions.

Les travaux publiés durant ces vingt dernières années sur les prépositions ont contribué à en renouveler l’approche sur les plans syntaxique, sémantique et distributionnel. On ne dispose cependant pas actuellement d’études statistiques menées sur de vastes corpus en vue de détecter les variations diachroniques de la combinatoire préférentielle des prépositions. Tel est l’objectif général du présent projet. <br /> Cet objectif se décline en sous-objectifs : I) Améliorer nos connaissances sur la combinatoire des prépositions du français, de l’ancienne langue (IXe s) jusqu’au français contemporain ; ii) Observer et problématiser l’émergence, la réorganisation et le déclin de structures figées ; iii) Établir des rapports entre les fluctuations fréquentielles de la combinatoire prépositionnelle, la recherche de plus-values sémantiques ou discursives et les besoins d’expression au sein d’une société ; iv) Etablir des rapports entre certaines restructurations observées dans le système de la langue et les préoccupations sociétales ; v) Etendre le champ d’application de la notion de profil combinatoire à des schémas co-occurrentiels se manifestant dans des unités textuelles plus vastes. <br /> La projet s’est par ailleurs engagé à rendre accessible au maximum en téléchargement selon une licence ouverte les éléments suivants qui seront produits ou améliorés par le projet : lexiques et corpus d’apprentissage, logiciels de TAL et ressources associées, logiciels d'analyse de corpus. <br />

Pour la période du IXe s. au XXe s., on mettra au jour par une méthode alliant approches quantitative et qualitative des corpus, l’évolution en diachronie du profil combinatoire des prépositions françaises à, en, par, contre, dès, devant, entre, pour, sans, sur, sous, vers, dans. Notre attention se portera tout particulièrement sur la détection des combinaisons hautement spécifiques dans lesquelles entrent ces prépositions. Parmi les combinaisons significatives que le recours aux méthodes statistiques permettra de faire émerger, on trouvera des groupes prépositionnels plus ou moins figés. Un des objectifs consistera à observer ces combinaisons en diachronie fine : émergence et devenir des figements, évolution des valeurs sémantiques des groupes concernés, changement dans leurs voisinages préférés au sein de la phrase, modifications de position, etc.
On cherchera aussi à étendre le champ d’application de la notion de profil combinatoire à des schémas co-occurrentiels se manifestant dans des unités textuelles plus vastes : les modèles mobilisés seront le lexical Priming (Hoey, 2005) et l’encadrement du discours (Charolles, 1997).
Une autre des originalités du projet consistera à mettre en rapport l’évolution des structures figées de la langue, « faits sociaux » dans les termes de Durkheim, avec d’autres faits sociaux, qui, eux, correspondent à des préoccupations sociétales. Nous essaierons de dépasser l’opposition entre « histoire interne » et « histoire externe » de la langue en explorant une troisième voie, formée par des facteurs tributaires des deux pôles à la fois.

Une journée d’étude sera organisée en 2014 à Cologne. Un colloque international avec appel à communications sera organisé à Lyon (Univ. Lyon2 & ENS-Lyon) en 2015, pour la clôture du projet. Un ouvrage collectif sera élaboré, rendant compte du travail commun accompli dans le cadre de Presto
Les résultats de l'analyse linguistique seront mis à la disposition du public sur le site web du projet par l'intermédiaire d'une interface d'interrogation en accès libre ainsi que sous forme de sources SQL téléchargeables dotées d'une licence de type Creative Commons.
Les développements logiciels réalisés dans le cadre de la plateforme TXM seront diffusés en open-source avec la licence de logiciel libre GPL v.3. depuis le site de logiciels libres SourceForge.

Parvenir à une vision innovatrice du devenir historique sur la base d’un modèle d’analyse fondé sur deux séries de démarches méthodologiques : (1) l’étude de l’interdépendance entre le quantitatif (les emplois) et le qualitatif (les valeurs) ; (2) l’étude des principes qui ont guidé, en diachronie, la recherche de plus-values sémantiques et discursives, véritable moteur du changement linguistique.

Publications au 1er octobre 2013 (TO + 6 mois):

Blumenthal, P. (à par. 2014), « Caractéristiques et effets de la complexité sémantique de noms d’affect » in Nouvelles perspectives en sémantique lexicale et en organisation du discours, I. Nova

Ce projet a pour but l’étude diachronique de l’emploi, des valeurs sémantiques et discursives des prépositions françaises à, en, par, contre, dès, devant, entre, pour, sans, sur, sous, vers, dans, de l’ancienne langue jusqu’au français contemporain.
Outillée, adossée à une approche statistique et distributionnelle, cette étude portera sur les variations du comportement combinatoire des prépositions suivant des critères de dates (évolution diachronique), de genres et d’auteurs. Notre attention se portera tout particulièrement sur la détection des combinaisons hautement spécifiques dans lesquelles entrent ces prépositions. Nous étudierons l’émergence, la réorganisation et le déclin de structures prépositionnelles figées. Nous comptons parvenir à une vision innovatrice du devenir historique sur la base d’un modèle d’analyse fondé sur deux séries de démarches méthodologiques : (1) l’étude de l’interdépendance entre le quantitatif (les emplois) et le qualitatif (les valeurs) ; (2) l’étude des principes qui ont guidé, en diachronie, la recherche de plus-values sémantiques et discursives, véritable moteur du changement linguistique.
L’un des réquisits – mais aussi l’un des apports majeurs de ce projet - consistera en la constitution d’un corpus comportant des données étiquetées et lemmatisées, représentant toutes les périodes de l’histoire du français ainsi que différents genres discursifs et types de textes. Ce corpus, élaboré conjointement par les équipes française et allemande, s’appuiera pour partie sur les ressources déjà disponibles à Lyon (période médiévale), à Tours (XVIè s.), à Nancy (ATILF) et à Cologne (période moderne, XVIIè s.– XXè s.). Une politique active sera menée pour permettre l’ouverture de la plus grande partie possible de ce corpus.

Coordinateur du projet

Monsieur Denis VIGIER (Interactions Corpus Apprentissages Représentations) – denis.vigier@univ-lyon2.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Universität zu Köln Département des langues romanes de l'Université de Cologne
ICAR Interactions Corpus Apprentissages Représentations

Aide de l'ANR 238 135 euros
Début et durée du projet scientifique : mars 2013 - 36 Mois

Liens utiles