DS08 - Sociétés innovantes, intégrantes et adaptatives

Découverte dans les bAses Prosopographiques Historiques de coNnaissancEs – DAPHNE

Résumé de soumission

L'évolution et la maturité des technologies de l'information ont favorisé l'apparition d'une voie de recherche nouvelle dont le but est d'exploiter la puissance des ordinateurs pour la recherche littéraire et historique. Les Humanités Numériques sont devenues aujourd'hui une discipline à part entière dont le but, à la fois sociétal et technologique, est d'aller au-delà de la simple numérisation de contenus. Un nombre considérable de corpus accessibles en ligne est apparu dans le domaine des sciences humaines et sociales (par ex. Humanum ). Ces corpus constituent des gisements de données qui peuvent être les supports de recherches futures. Cependant, l’hétérogénéité de ces bases ainsi que l’absence de dispositifs permettant d'interroger ces données en connaissant et en comparant leur qualité, limitent leur exploitation pour valider des hypothèses scientifiques ou pour en extraire des connaissances. Il y a là un frein (qui peut même devenir un blocage) au développement des recherches en sciences humaines et sociales.
Nous nous concentrerons dans le cadre de ce projet sur les bases prosopographiques historiques. Les historiens disposent de très nombreuses sources (livres, actes, édits, registres) dont l'étude permet l'élaboration de bases de données prosopographiques, collections de fiches recensant le cursus des individus (études, professions, grades, etc), les lieux fréquentés, leurs enseignants, leur production scientifique ou littéraire. Ces bases, dont l'objet est l'étude de groupes sociaux, soutiennent une méthodologie consistant à émettre puis à confirmer des hypothèses. Les universitaires sont par exemple jusqu'au XIXe siècle une population itinérante. On peut se demander s'il existe des parcours-type en fonction de la période considérée et s'intéresser aux écarts entre le parcours d'un individu donné et ces parcours-type. Ceci nécessite la fouille, le croisement et l'enrichissement de données dans un contexte de données hétérogènes, où le temps est incertain, où les noms et propriétés des lieux ont souvent changé et où les données sont souvent incomplètes.

Cependant il est pour l’heure impossible de mobiliser facilement des mesures qui renseigneraient l’utilisateur et lui permettraient de savoir jusqu’à quel point il peut exploiter la donnée,en extraire de l'information fiable ou la réinsérer dans un autre corpus.

Ce travail de confrontation des hypothèses avec les faits ou d'établissement de règles est un travail entièrement manuel et est donc fastidieux. Vérifier une hypothèse implique de consulter les milliers de fiches de qualité variée pour identifier, avec un certain degré de certitude, les individus qui valident cette hypothèse ou au contraire ceux qui l'infirment. Chaque historien peut ainsi émettre plusieurs dizaines d'hypothèses conduisant à des centaines de règles sur chaque base prosopographique. Par ailleurs les bases prosopographiques étant par nature multidimensionnelles (espace, temps, fonctions, œuvres, rencontres, influences, etc), de nombreuses règles demeurent cachées aux historiens. De plus une telle évaluation est d'autant plus indispensable que la base a vocation à être nourrie par des experts nombreux et spécialisés qui n’ont donc pas plus que les utilisateurs ordinaires une connaissance de la totalité des données contenues dans la base.

Face à cette situation, les objectifs du projet DAPHNE sont i) d'automatiser l'extraction des connaissances sur lesquelles s'appuient les historiens, ii) d'étudier la formalisation du processus de validation des recherches historiques sur ce type de corpus et de caractériser dans quelle mesure ce processus est calculatoire, iii) d'introduire la prise en compte de la qualité des données et enfin iv) de proposer une plateforme intégrant les résultats obtenus. Toutes les phases du projet exigent une collaboration étroite entre historiens et informaticiens du consortium et déboucheront sur des résultats scientifiques en histoire comme en informatique.

Coordination du projet

Cédric Du Mouza (CENTRE D'ETUDES ET DE RECHERCHE EN INFORMATIQUE ET COMMUNICATIONS)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LARHRA Laboratoire de recherche historique Rhônes-Alpes
TECHNE TECHNOLOGIES NUMERIQUES POUR L'EDUCATION
UM-LIRMM Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
CEDRIC CENTRE D'ETUDES ET DE RECHERCHE EN INFORMATIQUE ET COMMUNICATIONS
LAMOP Laboratoire de Médiévistique occidentale de Paris UMR 8589

Aide de l'ANR 464 000 euros
Début et durée du projet scientifique : - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter