CE38 - La Révolution numérique : rapports aux savoirs et à la culture

Analyse et traitement automatique de discours – TALAD

Résumé de soumission

Ce projet a pour ambition de montrer comment le TAL permet à l’AD d'aller plus loin dans ses explorations, d’éprouver son appareil théorique et de renforcer son outillage méthodologique. Son objectif est d’adapter des techniques issues du TAL pour fournir à l’AD des jeux de descripteurs plus complexes, relatifs à différents niveaux d’organisation discursive, ainsi que des outils permettant de les composer dans des chaînes de traitement, en fonction des finalités recherchées. En retour, l’AD apportera au TAL un éventail de phénomènes complexes à étudier qui seront autant de défis à soumettre aux dernières avancées en TAL. Nous attendons de ces interactions un impact fort sur les pratiques en AD, qu’elle soit outillée ou non outillée. Cet impact sera évalué sur la problématique de la nomination, qui concerne notamment des personnes, lieux, événements, autrement dit des entités structurantes de l’espace public. La nomination est souvent, dans la sphère publique, utilisée comme outil de recatégorisation. En fonction des positions énonciatives, elle contribue à construire des référents, “colorer” la perception qui en est donnée, voire construire des associations (qui peuvent tendre à l'amalgame) qui impactent le débat. Ceci a particulièrement été saillant dans les récentes productions, politiques et médiatiques notamment, autour des termes migrants/immigrants/réfugiés/demandeurs d’asile/ candidats à l'asile /déracinés …, ou avec des syntagmes comme réfugiés et migrants / réfugiés climatiques / migrants économiques?/migrants mineurs/ migrants désespérés. Un traitement d’envergure, sur corpus, permettra d’observer la circulation des nominations, et d’observer comment les axiologies viennent aux nominations, comment elles évoluent, ou basculent. Le projet comporte ainsi des enjeux théoriques et scientifiques, mais aussi sociétaux et politiques.
La transposition des enjeux de la nomination en AD pour le TAL, doit passer par la production d’une ontologie des concepts de l’analyse du discours. En effet, l’AD a bâti un appareillage conceptuel robuste, mais varié, et fonction des différents courants, écoles, etc. Le rassemblement de chercheurs en AD autour de la nomination et la volonté de travailler en collaboration avec des TAListes à la création d’un corpus annoté et d’outils dédiés à l’étude de ce sujet a pour ambition d’aider à structurer les pratiques dans une visée d'opérationnalité. Par ailleurs, devant cette profusion terminologique, adopter une démarche ontologique aidera l’AD à mieux maîtriser la complexité de ses objets d’étude, travailler et stabiliser l’appareillage conceptuel afin de faciliter les discussions théoriques à partir d’un bagage commun. La proposition d’un schéma d’annotation défini sur cette base conduira à la distribution de l’ontologie et d'un corpus de recherche annoté, ce qui répondra à un besoin pour la communauté en AD : ce corpus annoté, librement diffusé, et assorti des travaux de synthèse du projet, constituera à la fois une avancée scientifique inédite pour le domaine, mais permettra aussi à la communauté de s’en saisir, et de pouvoir contribuer aux réflexions initiées. Ce corpus sera également le point d’interaction méthodologique et technologique entre les communautés de l’AD et du TAL, ce qui facilitera la dissémination des résultats dans chacune des communautés, et rendra compte de la plus-value des résultats pour chacune.

Coordinateur du projet

AGORA - EA7392 (Laboratoire public)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Laboratoire d'informatique
Praxiling
RETICULAR PROJECT
EQUIPE DE RECHERCHE : TEXTES, INFORMATIQUE, MULTILINGUISME
AGORA - EA7392

Aide de l'ANR 368 538 euros
Début et durée du projet scientifique : septembre 2017 - 48 Mois

Liens utiles