Débats parlementaires et Espace médiatique (1870-1940) : comprendre la CIrculation du discours politique grâce à des méthodes à forte intensité de DONnées – DECIDON
DECIDON vise à analyser les mécanismes de mise à l’agenda des problèmes publics par le Parlement de la Troisième République (1870-1940). Les parlementaires ont alors une grande autonomie dans le choix de l’ordre du jour de leurs discussions, et les débats parlementaires semblent suivre un cycle de vie propre, peu influencé par les fluctuations quotidiennes de l’opinion publique, incarnée par le discours de presse. Cependant, la recherche historique a montré les relations complexes entre presse et Parlement, et les jeux d’influence constants entre ces deux arènes. Pour mieux comprendre le fonctionnement de ce régime, tout en éclairant un peu plus le quotidien des parlementaires à l’époque, il est donc nécessaire d'évaluer à quel point la mise à l’agenda des problèmes publics est influencé par les choix des députés – et par les jeux de pouvoir au sein de l’arène parlementaire -, ou bien par la presse qui incarne et donne forme à l’opinion publique de l’époque. Une telle étude implique d’analyser la circulation du discours politique entre la presse et le Parlement dans la longue durée, et donc d’explorer de vastes corpus de documents anciens numérisés. DECIDON permettra à la fois de valoriser le corpus des débats parlementaires français numérisés, et de développer un pipeline complet et ouvert pour le traitement des corpus historiques, depuis la création du corpus jusqu'à sa publication en ligne sous forme de données FAIR enrichies. Toujours éclairées par des analyses historiques, les résultats seront obtenus en combinant des méthodes de vision par ordinateur et du traitement automatique des langues. DECIDON démontrera que les étapes critiques de l'analyse de la mise en page des documents, de l'OCR, de la reconnaissance des entités nommées, sont désormais à portée de main avec des solutions ouvertes et prêtes à l'emploi. Il a également comme objectif de modéliser finement le discours politique en s’appuyant notamment sur les capacités des grands modèles de langue.
Coordination du projet
Marie PUREN (ECOLE POUR L'INFORMATIQUE ET LES TECHNIQUES AVANCEES (EPITA))
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
ECOLE POUR L'INFORMATIQUE ET LES TECHNIQUES AVANCEES (EPITA)
CRH ECOLE DES HAUTES ETUDES EN SCIENCES SOCIALES PARIS
INRIA INSTITUT NATIONAL DE LA RECHERCHE EN INFORMATIQUE ET AUTOMATIQUE
BnF BIBLIOTHÈQUE NATIONALE DE FRANCE
ENCP ECOLE NATIONALE DES CHARTES PARIS
LARHRA Laboratoire de Recherche Historique Rhône-Alpes
Aide de l'ANR 610 899 euros
Début et durée du projet scientifique :
février 2026
- 42 Mois