DS07 - Société de l'information et de la communication

Heures : Reconnaissance de l'écriture manuscrite, catégorisation automatique, éditions – HORAE

Résumé de soumission

Le projet HORAE (Hours - Recognition, Analysis, Editions) propose d’étudier les pratiques religieuses de la fin du Moyen Âge à travers les livres d’heures, le plus grand best-seller de tout le Moyen Âge et associe trois partenaires en Humanités et Sciences de l’Ingénieur du public et du privé pour une recherche transdisciplinaire : l’Institut de Recherche et d’Histoire des Textes (IRHT, UPR 841), la société TEKLIA et le Laboratoire des Sciences du Numérique de Nantes (LS2N, UMR6004).
Les livres d’heures, avec plus de 5 000 témoins conservés, forment en effet un ensemble crucial pour comprendre l’univers mental médiéval. Pourtant leur contenu textuel est très peu étudié, alors que la production d’un si grand nombre de manuscrits est un phénomène culturel et industriel capital qui manifeste les profonds changements du monde religieux du bas Moyen Âge, avec, à la fois, le développement d’une production livresque proto-industrielle et le passage de l’économie de la demande à celle de l’offre, mais aussi l’éveil de l’individu et l’intériorisation de la foi, à une époque où l’encadrement ecclésial devient de plus en plus contraignant. Les livres d’heures sont à la fois des objets de luxe avec des enjeux de mise en scène sociale et des objets intimes, munis de fonctions dévotionnelle, mémorielle, eschatologique.
HORAE combine les compétences et recherches des trois partenaires en intelligence artificielle appliquée à l’analyse d’image par ordinateur, en traitement automatique des langues (TALN), et en histoire du livre et des pratiques religieuses. Le projet a pour ambition de créer une chaîne complète depuis le traitement des images numériques jusqu’à la production des savoirs en plaçant l’utilisateur final au centre des développements, en veillant aux formats, à l’interopérabilité, à la pérennisation des données, mais aussi à l’ergonomie et aux problématiques de visualisation de données massives.
Les objectifs comprennent : (1) l’utilisation des nombreux manuscrits numérisés présents en ligne et sous-utilisés ; (2) des nouveaux logiciels open source de reconnaissance d’écri¬ture manuscrite adaptés aux manuscrits médiévaux (HTR, Handwritten Text Recognition) ; (3) des outils de segmentation et de repérage de plagiat adaptés aux manuscrits médiévaux retranscrits par la machine, afin d’identifier les textes transmis par les livres d’heures ; (4) le repérage et l’édition des textes inédits ; (5) la visualisation des ‘clusters’ de manuscrits présentant les mêmes caractéristiques textuelles, avec l’ordre des différentes parties (petit office de la Vierge, offices votifs, suffrages, prières), mais aussi l’ordre des unités textuelles qui permet de repérer les usages liturgiques ; (6) l’étude de la diffusion et de la circulation des textes dévotionnels et liturgiques transmis par les livres d’heures du Moyen Âge pour mieux comprendre la culture et la foi des XIIIe-XVIe siècles.
Avec ses objectifs et ses méthodes, HORAE change radicalement les pratiques des sciences de l’érudition en renversant la problématique de la masse de données. Si les livres d’heures ont été jusqu’ici peu étudiés pour leur texte, c’est parce qu’ils sont trop nombreux, trop répétitifs et trop complexes. C’est précisément le nombre, la répétition des mêmes textes et la complexité qui rendront efficace les technologies développées dans ce projet pour parvenir à de nouveaux outils et obtenir de nouvelles conclusions historiques.

Coordinateur du projet

Monsieur Dominique Stutzmann (Institut de Recherche et d'Histoire des Textes (UPR 841))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

IRHT Institut de Recherche et d'Histoire des Textes (UPR 841)
LS2N (ex-LINA) Laboratoire des Sciences du Numérique de Nantes
Teklia TEKLIA

Aide de l'ANR 402 120 euros
Début et durée du projet scientifique : décembre 2017 - 36 Mois

Liens utiles