BLANC - Blanc 2007

– M3

x

Résultats

Perspectives

Productions scientifiques et brevets

Résumé de soumission

Ce projet explore la variabilité linguistique entre le Mandarin et le Français par la - modélisation de leurs réseaux lexicaux fondée sur des avancées récentes de la - théorie des graphes. La confrontation des prédictions des modèles avec des - expérimentations en psycholinguistique servent d'une part à l'évaluation des modèles - et d'autre part à évaluer la pertinence des invariants qu'ils mesurent entre le réseau - paradigmatique des verbes du Français et le réseau paradigmatique des verbes du - Chinois Mandarin. Le protocole des expérimentations autorise leur mise en oeuvre - tant en Français qu'en Mandarin et sur des sujets adultes et enfants, ce qui permet de - recueillir des données linguistiques intéressantes pour effectuer une analyse - comparative. Plus précisément durant les expérimentations les participants sont - amenés à produire des approximations verbales (par exemple 'casser' utilisé à la - place de 'déchirer') dans la langue du participant. Le projet propose d'effectuer une - analyse linguistique comparative et systématique de ces approximations grâce à une - mesure sémantique inspirée d'un travail plus général sur certains types de graphes : - les petits mondes hiérarchiques. - Dans le cadre de ce projet, ces graphes sont portent des informations de nature - lexicale : leurs sommets sont des verbes tandis que leurs arêtes sont des relations - paradigmatiques, la synonymie mais aussi l'hyperonymie. Dans le cas du Chinois - Mandarin, un graphe sera construit pour les mots et un autre pour les caractères - puisque ces derniers sont porteurs de sens. Afin de comparer systématiquement le - français et le mandarin, un model (PROX) qui calcule dans un continuum - multidimensionnel la proximité sémantique entre entités lexicales sur des graphes - lexicaux paradigmatiques permet de développer une métrologie du sens des verbes - pour chacune de ces deux langues. - Les angles d'approches radicalement indépendants menés d'une part par les - expérimentations psycholinguistiques et d'autre part par la modélisation linguistique - basée sur les graphes permettent une validation croisée. Cette validation est déjà - bien avancée sur le Français : (i) le graphe paradigmatique des verbes en Français - est un petit monde hiérarchique, (ii) les approximations sémantiques produites au - cours des expérimentations sont des verbes très proches selon la mesure PROX. Le - projet a pour but de poursuivre ces observations en français et de les étendre au cas - du Chinois mandarin, une langue radicalement différente afin d'étudier les invariants - et la variabilité entre Français et Chinois Mandarin. - De plus, l'établissement de liens d'équivalence entre verbes des deux langues va - permettre d'effectuer un certain nombre de mesures sur les différentes régions du - lexique verbal et leurs dépendances à la langue. L'étape finale consistera à - déterminer quelles structures des réseaux lexicaux sont communes aux deux langues - et à quel niveau de généralité ces deux langues ont une même organisation lexicale. - Dans le cadre de la 'Global WordNet Association', la construction d'un grand nombre - de réseaux lexicaux, constituera une ressource importante pour généraliser notre - étude Franco-Taiwanaise à d'autres langues et lui conférer une dimension - translinguistique novatrice en matière de traitement automatisé du lexique des verbes. - En terme de valorisation, l'ensemble de nos résultats pour les deux langues - considérées Français et Chinois Mandarin seront accessibles en ligne sur le site - Prox.irit.fr de manière entièrement libre. ...

Organisme de recherche

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Aide de l'ANR 160 000 euros
Début et durée du projet scientifique : - 36 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.