DS0805 - Cultures, patrimoines, création

Projet d’Hypertexte de l’Œuvre de Balzac reposant sur l’Utilisation de Similarités – PHŒBUS

Résumé de soumission

Le projet consiste à mettre en résonance l’ensemble de l’œuvre balzacienne (La Comédie humaine, les romans de jeunesse, les contes drolatiques, le théâtre et les œuvres diverses) avec un vaste corpus d’écrits contemporains, à aires culturelles multiples et de nature variée, qui ont pu la nourrir : œuvres romanesques d’autres auteurs de l’époque ; recueils collectifs de littérature panoramique (auxquels Balzac apporta des contributions) ; ouvrages scientifiques susceptibles d’avoir influencé la création balzacienne, notamment dans les domaines de la médecine, de la physiologie et des sciences naturelles. Son objectif est de permettre des recherches et des comparaisons intertextuelles élaborées, à l’intérieur de l’œuvre de Balzac, et dans le corpus plus vaste de textes littéraires et scientifiques de l’époque, entre 1800 et 1850, afin de faire émerger des correspondances, de repérer des emprunts, des citations, des reprises, des plagiats éventuels, et de constituer ainsi une cartographie de l’univers intellectuel de Balzac à partir des traces que d’autres textes ont laissées dans l’œuvre.
Le projet, qui relève de ce qu’on appelle les « humanités numériques », vise à fournir aux chercheurs en littérature et sciences humaines de nouveaux outils d’interrogation de vastes corpus textuels, susceptibles de permettre une connaissance approfondie de phénomènes génétiques, poétiques, stylistiques, ainsi que leurs implications en termes idéologiques. Du point de vue de la méthodologie littéraire, il se situe dans le domaine de l’intertextualité, de l’interdiscursivité et de la génétique, auquel le corpus balzacien offre un champ d’application particulièrement fécond : Balzac a la spécificité de multiplier les supports d’écriture (livres, volumes collectifs, feuilletons, articles de journal), en réutilisant ses textes antérieurs ; en même temps, son œuvre, qui définit par son ampleur l’état socio-historique contemporain, se nourrit de l’apport d’autres textes (notamment ceux de la littérature panoramique), et intègre diverses formes de savoir qui dépassent le champ littéraire. Au terme de ce projet, on sera en mesure de cartographier les sources que Balzac a utilisées au cours de l’écriture des différents romans de La Comédie humaine.
Au niveau de l’informatique, dans le cadre d’une recherche sur les méthodes d’exploitation de vastes corpus textuels qui se pose aujourd’hui comme une nécessité, notre projet vise à mettre à profit les techniques algorithmiques contemporaines pour explorer systématiquement les réseaux de réutilisations textuelles. L’étude porte donc sur la mise en évidence automatique de réseaux de segments textuels présents à l'intérieur d’une œuvre d’un auteur et provenant de l’ensemble de l’œuvre de cet auteur et d'un corpus contemporain plus large. Nous souhaitons, dans ce projet, utiliser ces techniques pour fabriquer un prototype informatique de repérage de réemplois pour l’analyse intertextuelle, qui fournira aux chercheurs une méthode originale d’interrogation de très vastes corpus textuels.
La finalité du projet est donc de réaliser un objet scientifique nouveau en termes de méthode et de corpus : une édition hypertextuelle de Balzac, que personne n’a encore procurée à ce jour, comprenant une bibliothèque virtuelle constituée d’ouvrages qui appartenaient à son univers intellectuel. Cette édition sera accessible dans un site dédié, présentant trois manières d’utilisation : une visualisation générale sur le mode d’une cartographie, donnant des informations d’ordre statistique et quantitatif ; un déroulement linéaire permettant d’accéder à la comparaison entre les textes sources et les textes cibles par un système de double fenestrage ; la lecture intégrale d’une œuvre de Balzac, en « feuilletant » un texte dont les parties qui présentent des homologies avec d’autres textes seraient signalées.
Il va sans dire qu’une fois testée sur Balzac, cette approche pourra être généralisée à bien d’autres auteurs du patrimoine.

Coordinateur du projet

Monsieur Andrea Del Lungo (Analyses Littéraires et Histoire de la Langue)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

ALITHILA Analyses Littéraires et Histoire de la Langue
CELLF Centre d'étude de la langue et des littératures françaises
LIP6 Laboratoire d'Informatique de Paris 6

Aide de l'ANR 350 352 euros
Début et durée du projet scientifique : septembre 2015 - 36 Mois

Liens utiles