CE38 - Interfaces : sciences du numérique - sciences humaines et sociales

Lexhnology: modélisation linguistique et computationnelle de la structure discursive des textes juridiques appliquée à l’apprentissage des langues – Lexhnology

Résumé de soumission

Avec la croissance extraterritoriale du droit américain, ce droit domestique impacte de plus en plus les juridictions d’autres pays. La compréhension des textes de loi par les apprenants en anglais langue étrangère (L2) ainsi que par les professions juridiques est donc de première importance. Dans ce contexte, il est un présupposé selon lequel le fait d'expliciter les fonctions communicatives des écrits juridiques aide leur compréhension par les apprenants L2 de langue de spécialité (LSP).
Néanmoins il n'existe pas de consensus sur la définition linguistique des fonctions communicatives dans la jurisprudence. Par ailleurs, aucune technique de traitement automatique des langues (TAL) n'est actuellement capable d'identifier des fonctions dans ce contexte. Enfin, l’impact de l’explicitation des fonctions chez les apprenants de L2 n'a jamais été mesuré expérimentalement.

Ces manques soulèvent plusieurs questions: 1.Quelle typologie de moves et de prototypes d'opinions judiciaires peut-on établir en utilisant l'analyse des moves combinée à la linguistique de corpus et aux méthodes TAL ? 2. L'interaction avec un corpus avec des moves annotés améliore-t-elle la compréhension des arrêts (décisions judiciaires) ? 3. Quels sont les besoins et les cas d'utilisation pour les apprenants de l'anglais juridique en L2 et les enseignants des langues de spécialité concernant la lecture des arrêts ? 4. Comment l'accès à un corpus avec des moves annotés favorise-t-il l'autonomie de l'apprenant et de l'enseignant dans la lecture des arrêts chez les étudiants et juristes étudiant l'anglais juridique ? 5. Comment les modèles de langage neuronaux actuels représentent-ils la macro-structure du discours sous-jacente aux fonctions? Comment rendre l'apprentissage auto-supervisé “attentif” aux informations discursives? Comment construire une représentation du discours à partir de représentations contextuelles des mots? Comment rendre explicables les modèles neuronaux construits?

Lexhnology répondra à ces questions en conjuguant des compétences en linguistique, en TAL et en apprentissage des LSP. Seront produits et librement diffusés: une taxonomie et un guide d’annotation des fonctions communicatives des arrêts, un corpus annoté, une architecture neuronale et un modèle de langage pour la reconnaissance automatique, une ressource éducative libre formant à la lecture juridique à travers ces outils, un service en ligne d’analyse de corpus.

Coordination du projet

Mary C Lavissiere (Nantes Université)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

ATILF Centre national de la recherche scientifique
LS2N Nantes Université
CRINI Nantes Université
LAIRDIL Université Toulouse 3 - Paul Sabatier

Aide de l'ANR 511 956 euros
Début et durée du projet scientifique : January 2023 - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter