CE38 - La Révolution numérique : rapports au savoir et à la culture 2018

Numérisation et analyse du Dictionnaire universel de Basnage de Beauval: lexicographie et réseaux scientifiques – BASNUM

BasNum

en cours

Résultats

en cours

Perspectives

en cours

Productions scientifiques et brevets

en cours

Résumé de soumission

L’objectif principal du projet BASNUM est de numériser the Dictionnaire universel (DU) d’Antoine Furetière, dans la version de 1701 revue et corrigée par Basnage de Beauval, et de l’analyser avec des outils numériques, afin de faire apparaître l’importance de cet ouvrage pour l’évolution des sciences et des mentalités au XVIIIe siècle. Le projet vise également à contribuer au mouvement actuel de conception de méthodes innovantes de numérisation, encodage et analyse des textes.
Jusqu’à présent, aucune étude n’a cherché à évaluer l’étendue des transformations et des ajouts apportés par l’émigré français à l’ouvrage initial d’Antoine Furetière. Or, entre 1690 et 1701 le volume du dictionnaire triple ; par ailleurs, il connaît de nombreux et importants changements qualitatifs. L’hypothèse de travail est que, à la différence de Furetière qui le précède, mais aussi des membres de la compagnie de Jésus impliqués dans l’écriture du Trévoux (1704), Basnage conçoit son travail dans un esprit plus scientifique. Le résultat est un ouvrage descriptif, encyclopédique, et qui par endroits peut être vu aussi comme un dictionnaire d’apprentissage.
Au-delà de l’analyse de la méthode lexicographique de Basnage, le projet cherche à explorer la vision linguistique à partir de laquelle le DU est construit, et qu’il conforte en retour. Dans quelle mesure l’identité sociale et religieuse de Basnage affecte-t-elle son travail ? Peut-on voir dans la conception du dictionnaire non seulement une entreprise encyclopédique d’un membre de la « république des lettres », mais aussi un moyen de garder le lien avec la France, pour soi-même mais surtout pour la communauté émigrée qui cherche à préserver son identité culturelle en dépit de l’éloignement de sa patrie natale ?
Le projet cherche à tester ces hypothèses et à répondre à ces questions à travers une exploration systématique de l’ouvrage, c’est-à-dire assistée par ordinateur. Ceci implique, en premier lieu, la préparation du texte dans un format XML/TEI. Compte tenu du volume à traiter, le projet aura recours à GROBID, un outil d’acquisition automatique de texte semi-structuré, à l’amélioration duquel il contribuera en retour. Une fois le document source numérisé, et après des travaux de nettoyage et d’encodage supplémentaires, le DU va être comparé à des dictionnaires antérieurs et postérieurs. En troisième lieu, une série de requêtes va être écrite, afin d’extraire de l’information à propos des domaines scientifiques, techniques et professionnels couverts par Basnage ; de même, ces extractions vont permettre de mieux comprendre la position auctoriale de Basnage. Enfin, le projet cherchera à identifier le « corpus » lexicographique de Basnage, ainsi que les réseaux scientifiques et littéraires dans lesquels le DU s’inscrit. Pour ce faire, le projet aura recours à NERD, un outil de reconnaissance d’entités nommées développé par INRIA et mis à la disposition de la communauté scientifique via HUMA-NUM.
En résumé, BASNUM va :
• créer une édition numérique, en accès ouvert, d’un dictionnaire historique des plus importants, respectant les standards définis par l’action COST eNel ;
• permettre de mieux comprendre la contribution de Basnage à l’avancement de la lexicographie, ainsi que son rôle dans la « république des lettres » au début du XVIIIe siècle ;
• ouvrir la voie d’une analyse numérique du « corpus » lexicographique et des réseaux de connaissance impliqués par son entreprise ;
• faire avancer l’automatisation de l’acquisition des textes, notamment en ce qui concerne les documents semi-structurés ;
• contribuer à la mise en place de bonnes pratiques pour l’annotation de l’information sémantique et bio-bibliographique, en reliant ces informations à d’autres ressources disponibles sur la toile ;
• permettre d’améliorer les méthodes et techniques pour générer des connaissances linguistiques et historiques à partir de textes numérisés, et avec des outils numériques.

Geoffrey Williams (Arts et pratiques du texte, de l'image, de l'écran et de la scène)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Litt&Arts Arts et pratiques du texte, de l'image, de l'écran et de la scène
LATTICE Langues, textes, traitements informatiques, cognition
Inria Paris Centre de Recherche Inria de Paris

Aide de l'ANR 439 598 euros
Début et durée du projet scientifique : octobre 2018 - 36 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.