CE38 - Révolution numérique : rapports au savoir et à la culture

Le changement social en détail: un siècle de transformations sociales observées au ras du sol, 1836-1936 – SOCFACE

Résumé de soumission

Les XIXe et XXe siècles ont été une période de changements spectaculaires en France dont les grandes évolutions sont bien connues : historiens, économistes et sociologues étudient depuis longtemps l'urbanisation, l'industrialisation et la transition démographique en France. En revanche, on connaît beaucoup moins la variation spatiale de ces phénomènes, leurs mécanismes et leurs conséquences. En réalité, il y a un décalage entre les données macro à l’échelle nationale (ou départementale) qui renseignent le tableau d’ensemble et les nombreuses données micro qui présentent une histoire locale beaucoup plus précise mais difficile à généraliser. Cet écart empêche non seulement des analyses plus fines de la dynamique historique, mais limite également notre compréhension des mécanismes du changement social. Les sources pertinentes existent, mais les méthodes pour les collecter et les exploiter à l'échelle nationale restent à créer. C'est l'objectif du projet SOCFACE, qui va développer des méthodes innovantes en sciences informatiques afin de construire des ressources inestimables pour les sciences sociales.
SOCFACE va collecter et analyser, pour la première fois, l'ensemble des listes nominatives du recensement de 1836 à 1936. Produites tous les cinq ans, ces listes sont organisées spatialement (commune ; quartiers, hameaux ou rues ; maisons ; ménages). Elles résument les informations du recensement, en listant chaque individu avec certaines de ses caractéristiques, comme son nom, son année de naissance ou sa profession. La quantité considérable de listes (environ 15 millions d'images de 1836 à 1936, correspondant à 700 millions d'enregistrements individuels) et leur dispersion dans l'espace (elles sont conservées dans près d'une centaine d’archives départementales) ont limité leur utilisation jusqu'à présent. C’est ce verrou que SOCFACE entend lever en utilisant la reconnaissance automatique d’écriture manuscrite. Celle-ci permet aujourd'hui d’obtenir des transcriptions exploitables, mais elle repose sur des échantillons de données annotées issues du corpus cible ou sur des modèles linguistiques préalablement documentés. SOCFACE réunit archivistes, historiens, économistes, démographes et informaticiens travaillant ensemble pour lever les verrous technologiques qui empêchent le traitement à large échelle de grandes séries de documents historiques en développant des méthodes d'apprentissage auto-supervisées.
En outre, SOCFACE va apparier les individus entre les recensements en utilisant des méthodes automatisées développées récemment pour les recensements américains, en les adaptant aux sources françaises et en s'appuyant sur notre longue expérience dans la construction de bases de données historiques. SOCFACE sera le premier projet en France à apparier à grande échelle les observations d’un même individu en différents points du temps, ouvrant des possibilités de recherche considérables, tant pendant le projet qu'après lui.
Ainsi, SOCFACE représente une avancée sans précédent en termes de méthodes pour traiter de très vastes séries de documents historiques manuscrits, méthodes qui pourront ensuite être utilisées pour déchiffrer de nombreuses autres sources archivistiques, en France comme à l’étranger. SOCFACE produira une base de données complète de tous les individus ayant vécu en France entre 1836 et 1936 et l'utilisera pour analyser le changement social dans la longue durée, améliorant ainsi considérablement notre compréhension des structures économiques et sociales françaises. L'autre impact majeur de SOCFACE sera l'accès aux listes nominatives pour le grand public. Grâce à FranceArchives, nous diffuserons les informations disponibles dans les listes nominatives en Open Access, permettant à quiconque de parcourir librement des centaines de millions d'enregistrements. Ce sera une amélioration considérable comparé au nombre limité de collectes, le plus souvent partielles dans le temps et l'espace, disponibles aujourd'hui.

Coordination du projet

Lionel Kesztenbaum (Histoire et populations)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

EEP Ecole d'économie de Paris
TEKLIA / Principal
HISTOIRE Histoire et populations
SIAF Ministère de la Culture / SIAF

Aide de l'ANR 505 048 euros
Début et durée du projet scientifique : - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter