CE38 - Révolution numérique : rapports au savoir et à la culture

Dissidences religieuses et Réception de la Réforme à la Renaissance en Espagne – D4R

Résumé de soumission

Le projet Dissidences religieuses et Réception de la Réforme à la Renaissance en Espagne (XVIe s.) (dorénavant D4R) poursuit un double objectif en Humanités numériques : d'une part, le traitement d’un corpus du XVIe s. sur la Réforme en Espagne et, d'autre part, la mise au point d’un outil pour interroger de d’importantes masses documentaires, dans une perspective historique. Ce nouvel outil entend devenir un auxiliaire des chercheurs à l’heure d’exploiter des corpus textuels hétérogènes en histoire, en disposant d’outils d’annotation et d’interrogation des masses documentaires. Le projet D4R, qui réunit des historiens, linguistes et des informaticiens français et espagnols vise à rendre possible l’exploration dynamique d'un corpus documentaire constitué (sources inquisitoriales, d’une part, et traités de spiritualité, de l’autre) par le biais d’une plate-forme numérique qui, en mettant à disposition un algorithme et une ontologie évolutive, offre une aide semi-automatique au traitement de données parcellaires et de sources documentaires hétérogènes.
Le corpus documentaire est composé, d'une part, de 26 ouvrages imprimés du XVIe siècle (1 620 000 mots estimés) — dont six déjà retranscrits (520 000 mots environ) — et, d'autre part, d'un ensemble de sources d'archives manuscrites, à ce jour retranscrites et corrigées (près de 850 000 mots). La saisie des réseaux d'intertextualités constitue une pierre angulaire de cette approche. L’analyse des ouvrages imprimés est parallèlement couplée avec l'exploitation des sources d'archives inquisitoriales, qui donnent à voir plus précisément le processus de définition de l’hérésie, c'est-à-dire de criminalisation de propositions et de doctrines considérées, jusqu’aux décennies 1520-1540, comme orthodoxes.
À cette fin, une partie des fonds est l’objet d’un traitement d’OCRisation adapté à l’imprimé ancien au moyen de solutions IA existantes. Les corpus de textes sont ensuite soumis à une chaîne de traitement linguistique pour rendre performant le requêtage. D4R se propose alors d’explorer une approche innovante des sources en s’appuyant sur une plate-forme informatisée et en mettant en œuvre une méthodologie ascendante où l’humain et l’algorithme vont construire collaborativement, itérativement et interactivement une nouvelle ontologie du domaine d’intérêt et/ou de la question étudiée.
L’algorithme travaille sur un corpus structuré, annoté en amont au cours de trois phases d’enrichissement successives : balisage des structures textuelles, chaîne de traitement linguistique et calculs textométriques, et enfin annotation complémentaire de type historique. L’objet final consiste en la réalisation d’une plate-forme « d’aide à l’exploration » promettant au chercheur un gain de productivité lors de la fouille d’un corpus documentaire grâce à l’assistance d’un algorithme basé sur l'intégration d'un ensemble de techniques récentes mais éprouvées de fouille de texte. Le résultat de chaque exploration prend la forme d'une co-construction de connaissances à partir d'une ontologie initiale relevant du domaine étudié. Un autre défi de cette tâche consiste à fournir à l'utilisateur de la plate-forme une représentation synthétique du corpus sous la forme d'une ontologie de concepts qu'il peut manipuler, interroger, et faire évoluer en pilotant l'algorithme.
Le projet D4R entend tout à la fois valoriser un corpus et mettre au point un outil ayant vocation à être développé à l’intersection de plusieurs langues dans un projet européen ultérieur qui regroupera quinze universités européennes et d’outre-mer et portera sur la réception de la Réforme dans les territoires des monarchies ibériques au XVIe et au XVIIe siècle siècle (Péninsule ibérique, Flandre, Italie du Sud, Amériques et Asie).

Coordination du projet

Michel BOEGLIN (INSTITUT DE RECHERCHE INTERSITE ETUDES CULTURELLES)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

IRIT Institut de Recherche en Informatique de Toulouse
PRAXILING PRAXILING
GRIAL GRupo de Investigación en Aplicaciones Lingüíticas
UCLM DeReHis Universidad Castilla-La Mancha / DEREHIS
UAB - UHM Universidad Autonoma de Barcelona / Unidad de Historia Moderna
IRIEC INSTITUT DE RECHERCHE INTERSITE ETUDES CULTURELLES

Aide de l'ANR 422 364 euros
Début et durée du projet scientifique : janvier 2022 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter