DS0705 -

Transformation de registres par extraction de motifs langagiers – TREMoLo

TREMoLo : transformation de registres par extraction de motifs langagiers

Le projet TREMoLo étudie l'emploi des registres de langue et vise à développer des méthodes automatiques de transformation de textes d'un registre vers un autre.

Objectifs généraux

Les objectifs du projet TREMoLo sont de :<br />1. étudier et caractériser l'emploi des registres de langue dans des textes écrits ;<br />2. développer des méthodes automatiques de transformation de textes d'un registre vers un autre ;<br />3. paver le chemin pour une généralisation de l’approche à d’autres composantes stylistiques du langage.<br /><br />Ces objectifs touchent principalement aux domaines du traitement automatique du langage naturel en informatique et de<br />l’étude variationnelle du langage en linguistique et sociolinguistique.

La démarche globale du projet tient en deux phases principales :
1. Décrire linguistiquement des textes d'un registre et en extraire des motifs séquentiels discriminants.
2. Produire automatiquement des paraphrases de textes de tel sorte à coïncider avec les motifs d'un registre visé.

/

Le projet se situe dans une optique de recherche exploratoire visant la production de connaissances fondamentales en linguistique et une ouverture à terme vers d'autres types de variations stylistiques. Les débouchés applicatifs de ces travaux sont dans les domaines de l'interaction humain-machine et de l'aide à la maîtrise du langage.

/

Le registre de langue a une forte influence sur l'expressivité véhiculée par un énoncé. Il s’agit pourtant d’un aspect du langage encore largement marginal en traitement automatique des langues (TAL), domaine dominé par l’étude de la dimension informationnelle du langage. En réponse à ce manque, le projet TREMoLo s'intéresse à la notion de registre de langue, avec le français comme langue d’étude. Les objectifs sont de progresser dans l’étude des registres de langue et de développer des méthodes automatiques de transformation de textes d'un registre vers un autre. Ce travail s’appuiera sur l'extraction de patrons linguistiques spécifiques à des registres donnés et sur leur prise en compte dans un processus de production automatique de paraphrases. La bonne conduite du projet sera assurée par les compétences fortes et complémentaires des membres de l’équipe dans ces thématiques.

Le projet TREMoLo se situe dans une optique de recherche exploratoire dont l'objectif à long terme est de produire des connaissances fondamentales pour les approches d'extraction de régularités stylistiques spécifiques de textes et de production automatique de langage naturel. Les registres de langue sont un cas d'étude stratégique vers cet objectif à long terme.

Le projet s’inscrit dans le mouvement actuel visant l’étude du style des textes, mouvement nourri par l’intérêt des nombreuses applications possibles. On peut citer, par exemple, l'authentification de textes, l’accès à l’information, l'amélioration de systèmes de dialogue humain-machine et l'aide à l'apprentissage des langues. Les retombées sociétales du projet se situent naturellement dans ces domaines en offrant la possibilité de moduler des textes. Scientifiquement, les avancées du projet tiennent principalement dans l’utilisation conjointe de techniques de fouille de données et des approches statistiques de TAL, ainsi que la découverte de nouvelles connaissances en linguistique et sociolinguistique. Ces différents points confèrent au projet un fort potentiel de valorisation industrielle.

Coordination du projet

Gwénolé Lecorvé (Institut de recherche en informatique et systèmes aléatoires)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

IRISA Institut de recherche en informatique et systèmes aléatoires

Aide de l'ANR 268 274 euros
Début et durée du projet scientifique : septembre 2017 - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter