La mathématique de la phonotactique segmentale – MathSegPhon
Les langues se distinguent largement par leurs inventaires de sons phonologiques. La théorie de l’optimalité (OT) modélise les inventaires phonologiques en classant des contraintes de cooccurrence de traits (FCCs) qui pénalisent certaines combinaisons de valeurs de traits. Ce projet se propose de développer la première théorie exhaustive de FCCs en s’appuyant sur l’Hypothèse de l’Arbre (TH). Celle-ci soutient que ces contraintes définissent des implications universelles parmi les traits que l’on peut représenter grâce à un graphe d’interaction de trait sans boucles, c’est-à-dire un arbre. Le projet explore la TH dans une perspective de typologie et d'acquisition à travers quatre work-packages (WPs).
Quelles sont les implications typologiques de la TH ? quels types d'inventaires segmentaux cette hypothèse exclut elle ? Le WP1 pose ces questions à travers une analyse formelle des typologies factorielles OT prédites par la TH. Cette analyse reposera sur une « boîte à outils » pour les analyses factorielles formelles récemment développée par A. Prince (Rutgers University) et N. Merchant (Eckert College), qui seront partenaires pour le WP1.
Un résultat d'insolvabilité obtenu précédemment par le candidat sera renforcé pour démontrer qu'apprendre la phonotactique segmentale est trop difficile (c'est à dire ne permet aucun apprenant général efficace) sans restrictions sur les FCCs. La structure typologique proposée par la TH (développée dans le WP1) suffit elle à permettre un apprentissage efficace ? C'est la question que pose WP2, dans la perspective d'apprenants à la fois en batch et error driven learning. L'objectif est d'obtenir des garanties analytiques plutôt que de simples résultats de simulation. Cette partie du projet sera assurée par le candidat, en concertation avec Prince et Merchant. Il se fonde sur un résultat pilote qui a établi l'apprenabilité d'un cas particulier, celui où le graphe d’interaction de trait est un directed path, le type d'arbre le plus simple.
La structure typologique prédite de manière formelle par la TH (WP1) et justifiée par l'apprenabilité (WP2) est elle effectivement attestée ? Pour répondre à cette question, WP3 harmonisera les bases de données existantes d'inventaires segmentaux. Il développera un logiciel pour extraire automatiquement les inventaires de types de segments de la base de données ainsi réalisée. WP3 sera exécuté par S. El Ayari (SFL), en collaboration avec le candidat et un postdoctorant spécialisé en phonologie segmentale (recruté pour 18 mois).
WP4 développera alors un système de FCCs qui obéit à la TH et produit une typologie factorielle OT d'inventaires segmentaux correspondant à la typologie documentée dans la base de données. Sera également prise en considération la question de savoir si cette correspondance peut être obtenue grâce à des FCCs phonétiquement fondé(e)s (dans le sens de Hayes et Steriade 1999), explorant ainsi le lien entre apprenabilité formelle et substance phonétique. Le postdoc sera le principal responsable de WP4, sous la supervision du candidat et en collaboration avec F. Torres-Tamarit et Prince.
Le projet offre donc un nouvel élan à la recherche d'universaux linguistiques, en s'éloignant des universaux concrets étudiés dans la littérature (comme « toutes les langues ont une occlusive coronale ») pour se diriger vers des universaux plus fondamentaux et formels comme la TH. En outre, le projet complète les arguments traditionnels de la « pauvreté du stimulus » par des arguments sur la difficulté de la tâche, qui consistent à prouver mathématiquement que le problème d'apprentissage est insolvable (quelle que soit la richesse de l'input) si l'on n'y intègre pas la structure d'universaux formels comme la TH. Grâce à une équipe complémentaire de spécialistes en apprenabilité mathématique et en phonologie segmentale, le projet élèvera l'axiome génératif d'un lien entre apprenabilité et typologie à un nouveau degré de sophistication mathématique.
Coordination du projet
Giorgio Magri (Structures Formelles du Langage)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
SFL Structures Formelles du Langage
Aide de l'ANR 112 626 euros
Début et durée du projet scientifique :
décembre 2016
- 24 Mois