Flash Info
CE38 - Révolution numérique : rapports au savoir et à la culture

Approche computationnelle des dynamiques d’influence entre agendas législatifs et médiatiques – Medialex

Approche computationnelle des dynamiques d’influence entre agendas législatifs et médiatiques

Dans quelle mesure la numérisation de l’espace public a-t-elle bouleversé la capacité des élus, des médias traditionnels et des publics à imposer les sujets prioritaires du débat public ? Pour répondre à cette question, le projet MEDIALEX propose de développer des méthodes numériques originales, en combinant des compétences de sciences sociales, à la fois quantitatives et qualitatives, avec des compétences en modélisation et en traitement automatique de la langue.

Enjeux et objectifs

Le défi scientifique que le projet MEDIALEX veut relever, consiste à renouveler notre compréhension des dynamiques d’influence entre les agendas parlementaires, médiatiques et publics. Autrement dit, le projet vise à mieux connaître la façon dont les parlementaires, les médias et les publics s’influencent les uns les autres dans la définition des sujets prioritaires du débat public.<br />Le premier objectif consiste à identifier les dynamiques d’influence réciproque entre les parlementaires, les médias et les publics dans l’établissement des sujets prioritaires. À une échelle globale et structurelle, il s’agit d’identifier, qui des parlementaires, des médias (imprimés, audiovisuels ou web) ou des publics (qui s’expriment sur les réseaux sociaux) parviennent à imposer les sujets prioritaires aux autres. Nous chercherons à distinguer plusieurs dynamiques d’influence, notamment entre les réseaux sociaux et les médias, entre les médias et le parlement, et entre les réseaux sociaux et le parlement. L’hypothèse que nous formulons est que la direction et la force de l’influence varient selon les thématiques considérées, et les contextes politiques. Le second objectif est de nature méthodologique. En prenant appui sur des travaux antérieurs menés par les partenaires de MEDIALEX, il s’agit de développer et d’opérationnaliser des méthodes d’identification automatique des thèmes qui traversent l’espace public, à un niveau de granularité plus fort que les travaux existants. Enfin, le troisième objectif vise à rendre compte des effets de la numérisation de l’espace public sur la capacité du législateur à imposer les thèmes du débat public. Il s’agit ainsi de renouveler notre compréhension du rôle du Parlement dans le débat public dans un contexte de numérisation.

Le projet MEDIALEX mobilise des méthodes issues des sciences sociales computationnelles, tirant parti de nouveaux cadres analytiques permettant de concilier les approches de sciences sociales avec les nouveaux outils informatiques (Cointet et Parasie, 2018 ; Boelaert, Ollion, 2018 ; Evans, 2020). Le défi méthodologique du projet consiste à développer des méthodes issues du traitement automatique du langage, de façon à permettre l’identification plus fine et à grande échelle des thèmes qui traversent le débat public. Ces méthodes concernent l’identification des événements sur Twitter, d’une part, et l’identification des discours rapportés dans des corpus volumineux et hétérogènes (journaux, télévision, radio, questions et débats parlementaires, Twitter et Facebook). D’une part, la méthode d’identification des événements sur Twitter a été développée et éprouvée par les partenaires du projet (Mazoyer et al., 2020). Celle-ci consiste à détecter des événements à partir de la similarité thématique des tweets et de leur proximité temporelle. Cette méthode permet d’identifier des thématiques à une échelle nettement plus fine que les méthodes du type topic modeling. D’autre part, il s’agit de développer une méthode permettant d’identifier les discours rapportés dans des corpus textuels volumineux et hétérogènes. L’approche reposera sur des techniques d’apprentissage automatique et visera à reconnaître des triplets < source, support, propos_rapporté>. L’analyse reposera sur l’utilisation de modèles de langage récents (Bert pour le français, Camembert ou Flaubert), qui ont montré de bonnes performances pour une tâche similaire avec l’anglais (Luo et al., 2020).
Le projet MEDIALEX entend mobiliser ces méthodes computationnelles à la fois pour identifier des dynamiques globales d’influence entre acteurs parlementaires, médiatiques et publics, mais aussi pour analyser les dynamiques d’influence qui s’établissent à l’occasion de projets de loi spécifiques. Plusieurs lois seront identifiées au cours de la première année du projet, qui présentent un intérêt particulier du point de vue des mécanismes d’influence entre acteurs parlementaires, médiatiques et publics. A titre d’exemple, une grande loi économique et une loi liée à la thématique sécuritaire seraient pertinentes pour le projet.
Enfin, le projet accorde une grande importance à l’intégration d’une dimension qualitative aux analyses quantitatives et computationnelles. Il est tout particulièrement important d’étudier de façon qualitative la façon dont les parlementaires français mobilisent les réseaux sociaux et les médias plus traditionnels. Ce volet informera les analyses plus computationnelles, et permettra d’élaborer un ensemble d’hypothèses au contact des acteurs parlementaires notamment.

La vocation de MEDIALEX est essentiellement scientifique, mais compte tenu de son objet et des techniques mises en œuvre, nous souhaitons projeter les résultats de MEDIALEX dans le débat public. Il nous semble en effet que sous forme de prototype de recherche, la démarche entreprise par le projet permettra de concevoir de nouvelles manières de représenter l’espace public et l’activité politique. La démarche de MEDIALEX épouse ainsi des préoccupations majeures de nos sociétés concernant le rôle du Parlement, la production des politiques publiques, le rôle des médias et le renouvellement des formes de la démocratie.
Un projet “ouvert”. MEDIALEX inscrit ses travaux dans l’esprit de la science ouverte. Le projet ne déposera pas de brevet, les logiciels développés seront sous licence libre open source et les données rassemblées dans le projet seront rendues accessibles en open data sous formats ouverts (en respectant les contraintes éventuelles de confidentialité, vie privée ou propriété intellectuelle). Par ailleurs, MEDIALEX entend partager ses travaux (à travers les datasprints - WP1.3) et ses résultats à un ensemble d’acteurs de la communauté scientifique (en informatique comme en sciences sociales) et aux acteurs de l’écosystème (journalistes, acteurs politiques, fonctionnaires, militants associatifs des civic tech et citoyens) avec lesquels les membres du projet ont déjà un nombre important de relations et d’implications.
Communication scientifique. La dissémination scientifique du projet s’effectuera à travers des articles de revue académique de rang A, l’organisation d’une conférence finale et la publication d’un ouvrage académique. Les conférences et revues visées pour ces publications scientifiques sont la Revue française de science politique, Gouvernement et action publique et Parliamentary affairs, pour la science politique ; les conférences ICWSM (International Conference on Webbloging and Social Media) et IC2S2 (International Conference on Computational Social Science) pour les sciences sociales computationnelles ; New Media & Society, Big data & Society pour la sociologie et les sciences de l’information et de la communication.
Réflexivité institutionnelle. MEDIALEX entend enfin participer à la discussion sur la réforme des institutions en communiquant de façon spécifique les résultats aux acteurs politiques, journalistes spécialisés et acteurs engagés des civic tech. Plusieurs participants ont des liens importants avec des parlementaires et avec le monde des civic tech (Olivier Rozenberg, Etienne Ollion, Benjamin Ooghe-Tabanou), qui pourront être mis à profit lors des “datasprints” et des workshops prévus (WP1.3 et WP1.4). Sur certaines questions, relatives à la médiatisation du travail parlementaire, les membres du projet seront donc amenés à faire des propositions de politiques publiques.

Dans un contexte de déstabilisation de l’espace public liée au numérique, le projet MEDIALEX vise à renouveler la compréhension des dynamiques d’influence entre les agendas parlementaires, médiatiques et publics. Son objectif principal est ainsi de mieux connaître la façon dont les parlementaires, les médias et les publics s’influencent les uns les autres dans la définition des sujets prioritaires du débat public. Pour y parvenir, le projet entend développer de nouvelles méthodes computationnelles permettant de suivre les énoncés dans les différentes couches de l’espace public. En faisant collaborer sociologues, politistes, informaticiens et chercheurs en linguistique computationnelles, ce projet interdisciplinaire vise ainsi (1) à saisir les dynamiques d’influence réciproque entre l’agenda des parlementaires, des médias et du public, (2) développer des méthodes originales pour identifier des événements médiatiques et des propos rapportés dans de vastes corpus hétérogènes, et (3) étudier les effets de la numérisation de l'espace public sur la capacité du législateur à imposer les thèmes du débat public.

Le projet mobilise des méthodes issues des sciences sociales computationnelles, tirant parti de nouveaux cadres analytiques permettant de concilier les approches de sciences sociales avec les nouveaux outils informatiques. Le défi méthodologique du projet consiste à développer des méthodes issues du traitement automatique du langage, de façon à permettre l’identification plus fine et à grande échelle des thèmes qui traversent le débat public. Ces méthodes concernent l’identification des événements sur Twitter, d’une part, et l’identification des discours rapportés dans des corpus volumineux et hétérogènes (journaux, télévision, radio, questions et débats parlementaires, Twitter et Facebook).

Le programme scientifique de MEDIALEX se décompose en quatre work packages. Le premier rassemble les tâches de coordination, de gestion des corpus et de dissémination (WP1). Les trois autres WP explorent les jeux d’influence entre les agendas parlementaires, médiatiques et publics de trois façons complémentaires. Le WP2 envisage l’influence de façon structurelle, en visant à identifier sur la longue période quelle grande catégorie d’acteurs (parlementaires, médias, publics) parvient à imposer aux autres les sujets d’attention prioritaires. Le WP3 envisage l’influence à une échelle plus fine, en étudiant les mécanismes de circulation des discours entre les espaces parlementaires, médiatiques et publics. Enfin, le WP4 se concentre sur les interprétations qui sont produites par les médias et les publics à partir du travail parlementaire (WP4).

La vocation de MEDIALEX est essentiellement scientifique, mais compte tenu de son objet et des techniques mises en œuvre, le projet vise à contribuer au débat public. A travers des « datasprints » et des « workshops », le projet entend impliquer acteurs et experts autour de nouvelles manières de représenter l’espace public et l’activité politique. La démarche de MEDIALEX épouse ainsi des préoccupations majeures de nos sociétés concernant le rôle du Parlement, la production des politiques publiques, le rôle des médias et le renouvellement des formes de la démocratie.

Coordination du projet

Sylvain Parasie (Fondation Nationale des Sciences Politiques (Sciences Po))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

INA INA - Service de la Recherche
FNSP Fondation Nationale des Sciences Politiques (Sciences Po)
CREST Centre de Recherche en Economie et Stastistique - CREST
LATTICE Langues, textes, traitements informatiques, cognition

Aide de l'ANR 514 800 euros
Début et durée du projet scientifique : octobre 2021 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter