DS08 - Sociétés innovantes, intégrantes et adaptatives

Manipulation et obsolescence de l'information sur internet – MOII

Manipulation et Obsolescence de l'Information sur Internet

Les nouvelles technologies de communication ont permis l’émergence d’intermédiaires facilitant le recueil et la diffusion d’informations utiles aux deux côtés du marché. La production de cette information engendre des externalités négatives : les employeurs sont peu incités à détruire les offres d’emplois pourvues et les hôteliers, restaurateurs ou propriétaires ont intérêt à manipuler leur profil ou celui de leurs concurrents. Nous souhaitons mesurer l’ampleur de ces externalités.

Pourquoi il est important de détecter l'information obsolète et l'information manipulée sur internet

Le projet comprend deux axes.<br />Axe 1: l'information obsolète. Pourquoi les individus à la recherche d’un emploi préfèrent-ils les annonces récentes, et pourquoi les annonceurs renouvellent-ils fréquemment leurs annonces? Une explication plausible à ces deux phénomènes repose sur l’existence d’informations obsolètes sur les marchés de rencontre. La présence de postes vacants fantômes sur le web ne fait guère de doute. On trouve ainsi de nombreux témoignages de frustration où les internautes se montrent particulièrement vindicatifs à l’endroit d’entreprises dont les postes sont déjà pourvus.<br />Les individus à la recherche d’un emploi anticipent que les annonces plus âgées ont davantage de chances de publiciser des emplois déjà pourvus. Ils s’en détournent et préfèrent des annonces plus récentes. De leur côté, les annonceurs voient le flux de candidatures diminuer avec le temps. La probabilité de pourvoir l’emploi chute, ce qui les incite à renouveler leurs annonces.<br />Ce scénario laisse un certain nombre de questions en suspens. Quelle est l’ampleur de l’information obsolète? Ou plutôt, quelle est la proportion des annonces déjà pourvues? Les comportements de recherche mutuelle des employeurs et des chômeurs contribuent-ils à accroître cette proportion? À quel point nuit-elle au processus d’appariement entre chômeurs et postes vacants? Quelles en sont les conséquences macroéconomiques?<br />Axe 2: Manipulation d'information. Il est devenu banal de choisir un restaurant ou un hôtel à partir d’un site web spécialisé. Ces sites permettent de consulter les différentes caractéristiques de chaque établissement, ainsi que la liste des commentaires et des évaluations laissées par les clients. Mais comment s’assurer de la fiabilité de ces informations? Les hôteliers ou restaurateurs n’ont-ils pas intérêt à déposer (ou à faire déposer) des évaluations qui leur sont favorables ou qui sont défavorables à leurs concurrents?<br />Le but de cet axe est de mesurer le phénomène de manipulation de l’information sur les plateformes numériques consacrées aux hôtels et aux restaurants. Pour atteindre cet objectif, il est nécessaire de parvenir à identifier la manipulation de l’information. Cela requiert de comprendre les conditions dans lesquelles une telle manipulation peut avoir lieu. Les modalités techniques proposées par les différents sites internet de comparaison d’hôtels et de restaurant facilitent-elles ou découragent-elles la manipulation des évaluations? De même, le contexte concurrentiel dans lequel évoluent hôteliers et restaurateurs les incitent-ils plus ou moins à manipuler leurs évaluations et éventuellement celles de leurs concurrents? Comment tenir compte de la sélection opérée par les consommateurs et les producteurs sur les plateformes et de son influence sur la distribution des évaluations? Le projet envisage de répondre à ces questions en alliant modélisation théorique et analyse des évaluations recueillies sur différents sites internet.

Nous combinons méthodes de web scraping permettant le recueil à grande échelle de données sur internet et modèles structurels des comportements des acteurs présents sur les différents sites.
Pour ce qui concerne l'information obsolète, nous avons constitué un panel d’annonces à partir des sites américains de Craigslist, Monster et Indeed. Nous estimons des taux de mortalité et des taux de renouvellement des annonces par âge. Ces taux seront ensuite intégrées aux modèles structurels pour en déduire la proportion de postes fantômes, la distribution des efforts de recherche par âge des annonces, et la distribution des âges de renouvellement des annonces.
Nous étudions en parallèle les conséquences macroéconomiques liées à la naissance et à la propagation de l'information obsolète. Nous exploitons à cette fin un modèle théorique engendrant des fluctuations endogènes. Nous calibrons le cycle déterministe de ce modèle sur des données macroéconomiques de pays de l'OCDE.
Pour ce qui concerne la manipulation d'information, nous avons récupéré les évaluations d’un grand nombre d’hôtels et de restaurants à partir des sites TripAdvisor, Expedia, Booking, TheFork et OpenTable, ainsi que les évaluations d'un grand nombre de biens offerts à la location sur AirBnB. Nous avons commencé à relier ces données à l'intensité de la concurrence locale (pour les hôteliers et les restaurateurs) ainsi qu'au taux de disparition et d'apparition des propriétés sur AirBnB.
Dans un registre différent mais complémentaire, nous exploitons des données de Pôle Emploi. Sur Pôle Emploi, certaines annonces stipulent un salaire et d'autres non. Nous connectons ce comportement différencié au type d'emploi et à l'intensité de la concurrence locale entre employeurs.

Notre travail sur l'information obsolète a donné naissance à deux articles principaux.
(i) Dans «Directed search with phantom vacancies«, les demandeurs d'emploi candidatent aux emplois disponibles en fonction de l'âge des annonces. La formation d'un appariement avec une annonce d'âge-a crée un fantôme du même âge avec probabilité ß, engendrant ainsi une externalité affectant les offres d'emploi d'âge au moins égal. L'externalité diminue avec l'âge de l'annonce prospectée et les demandeurs d'emploi expriment une préférence trop forte pour les annonces récentes. Nous calibrons le modèle à l'aide de données américaines. La présence de fantômes réduit significativement l'efficacité du processus d'appariement.
(ii) Dans «Phantom cycles«, les cycles fantômes sont des fluctuations déterministes causées par la dynamique des postes fantômes et son interaction avec l'offre de vacance. Ces cycles sont plus pertinents pour les marchés du travail sclérosés (comme la France) que pour les pays à forte rotation du personnel (comme les États-Unis). Nous utilisons un modèle de chômage d'appariement avec offres d'emploi fantômes. Ce modèle engendre des cycles limites associés à une bifurcation de Hopf. Nous calibrons ces cycles sur données agrégées pour 6 pays de l'OCDE.
Nos travaux sur la manipulation de l'information ont donné naissance à deux articles principaux.
(iii) Dans «Can Information Reduce Ethnic Discrimination? Evidence from Airbnb», nous utilisons les données d'Airbnb pour identifier les mécanismes de discrimination à l'égard des hôtes issus de minorités ethniques. Dans le même quartier, les hôtes issus de groupes minoritaires facturent 3,2 % de moins pour des annonces comparables. Comme les notes fournissent aux clients des informations sur la qualité d'une annonce, nous pouvons mesurer la contribution de la discrimination statistique. Cette forme de discrimination peut rendre compte de l'ensemble de l'écart de prix ethnique. Les trois quarts de l'écart ethnique initial peuvent être attribués à des croyances inexactes des clients potentiels sur les caractéristiques du groupe d'hôtes.
(iv) Dans «Looking for the `Best and Brightest': Hiring difficulties and high-skilled foreign workers«, nous montrons que les employeurs américains sont plus susceptibles de rechercher des travailleurs qualifiés étrangers pour des postes où trouver des travailleurs domestiques prend du temps. Nous combinons des données obtenues en ligne sur la durée des offres d'emploi aux données administratives des Labor Condition Applications, première étape de la demande de visas de travailleur qualifié temporaire H-1B. Nos résultats ne sont pas dus aux entreprises manipulant la durée de leurs offres d'emploi pour démontrer leur bonne foi dans leur recherche de travailleurs domestiques. Au contraire, nous stigmatisons l'insuffisance de l'offre de main-d'œuvre locale dans les professions en tension.

L’objectif scientifique principal est de finaliser les articles existant. On dénombre ainsi 8 articles académiques en cours, dont deux acceptés pour publication, trois soumis pour publication et trois doivent encore faire l’objet de modifications avant leur soumission pour publication.
Le deuxième objectif scientifique, c’est l’organisation d’une manifestation scientifique à Aix-en-Provence.
Il s’agit d’un colloque consacré à l’étude économique des plateformes numériques, celui que nous aurions déjà dû organiser en 2020 ou en 2021. Celui-ci aura lieu à Aix-en-Provence et durera deux journées. L’équipe y présentera deux articles en cours, l’article qui fonde le versant empirique du projet consacré à l’information obsolète, et l’article consacré aux manipulations des revues des hôtels et des restaurants.

Albrecht, J., Decreuse, B., Vroman, S., 2022. Directed search with phantom vacancies. International Economic Review
Chéron, A., Decreuse, B., 2021. Phantom cycles. Mimeo, à soumettre pour publication
Decreuse, B., Wilemme G., 2021. Age discontinuity and nonemployment benefit policy evaluation through the lens of job search theory. Mimeo, soumis pour publication
Decreuse, B., Flachaire, E., Hachème, G., 2021. Why employers post wages in job ads: evidence from French online data. Mimeo, à soumettre pour publication
Decreuse, B., Raux, M., Sangnier, M., 2021. Ghosbusters. Mimeo, à finaliser.
Decreuse, B., Laouenan, M., 2021. Death and resurrection on the AirBnB platform. Mimeo, à finaliser
Laouenan, M., Rathelot, R., 2022. Ethnic Discrimination on an Online Marketplace of Vacation Rentals. American Economic Journal.
Raux, M., 2021. Looking for the `Best and Brightest': Hiring difficulties and high-skilled foreign workers. Mimeo, soumis pour publication.

Le projet est centré sur l’étude de la qualité de l’information disponible sur internet. Il s’articule autour de deux axes : l’obsolescence et la manipulation de l’information. Les nouvelles technologies de communication ont permis l’émergence d’intermédiaires facilitant le recueil et la diffusion d’informations utiles aux deux côtés du marché. On peut cependant questionner l’efficacité de cette information dans la mesure où sa production engendre des externalités négatives : les employeurs sont peu incités à détruire les offres d’emplois pourvues et les hôteliers ou restaurateurs peuvent avoir intérêt à manipuler les notes ou commentaires laissés sur leur profil ou sur ceux de leurs concurrents. Nous souhaitons mesurer l’ampleur de ces externalités en combinant méthodes de web scraping permettant le recueil à grande échelle de données sur internet et modèles structurels des comportements des acteurs présents sur les différents sites.
D’une part, nous allons constituer un panel d’annonces à partir des sites américains de Craigslist, Monster et Indeed et du site français de Pôle Emploi. Nous estimerons des taux de mortalité et des taux de renouvellement des annonces par âge. Ces taux seront ensuite intégrées aux modèles structurels pour en déduire la proportion de postes fantômes, la distribution des efforts de recherche par âge des annonces, la distribution des âges de renouvellement des annonces et l’impact des informations obsolètes sur le chômage et l’efficacité du processus d’appariement. D’autre part, nous allons récupérer les évaluations d’un grand nombre d’hôtels et de restaurants à partir des sites TripAdvisor, Expedia, Booking, TheFork et OpenTable. Nous confronterons la distribution empirique des évaluations à des distributions contrefactuelles théoriques pour détecter les comportements de manipulation. Nous monterons ensuite comment le contexte concurrentiel local affecte ces comportements. Nous mettrons l’accent sur les guerres de manipulation entre offreurs sur ce type de site. Les différents travaux tiendront compte de la sélection des couples de consommateurs et de producteurs dans le processus de formation des évaluations.
Le consortium comprend cinq chercheurs seniors et un doctorant : trois chercheurs à dominante empirique maîtrisent les techniques de web scraping ; deux chercheurs à dominante théorique sont spécialistes des frictions de recherche et d’appariement. Le projet engage aussi des coauteurs étrangers basés aux Etats-Unis, au Royaume-Uni, au Canada et en Australie. Les résultats du projet seront médiatisés sur un site web spécifique qui mettra à disposition des chercheurs tout ou partie des bases de données constituées ainsi que les programmes utilisés lors d’estimations statistiques ou de simulations numériques. Le budget demandé est de 208 527 euros sur une durée de 36 mois. Il correspond à des achats de matériel informatique et en particulier des stations de travail utiles au recueil et au traitement des données ainsi qu’aux simulations numériques des modèles structurels, des frais de mission en France et à l’étranger, des frais d’expertise informatique et à l’organisation d’une conférence sur deux jours.

Coordination du projet

Bruno Decreuse (Groupement de Recherche en Économie Quantitative d'Aix-Marseille)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

GREQAM Groupement de Recherche en Économie Quantitative d'Aix-Marseille
CES - UMR8174 (UP1/CNRS) Centre d'économie de la Sorbonne
GAINS GROUPE D'ANALYSE DES ITINERAIRES ET NIVEAUX SALARIAUX
LEMNA LABORATOIRE D'ECONOMIE ET DE MANAGEMENT NANTES ATLANTIQUE

Aide de l'ANR 208 526 euros
Début et durée du projet scientifique : March 2018 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter