ANR-FRQSC-2 - AAP franco-québécois en Sciences humaines et sociales

Recherche d'information dans les collections de musique notée – MuNIR

MuNIR, vers des moteurs de recherche appliqués aux collections de partitions numérisées

Le projet MuNIR a pour objectif de concevoir et valider de nouveaux outils pour gérer et manipuler des partitions musicales numérisées. Le potentiel de cette numérisation reste dépendant de la levée de plusieurs verrous. Les verrous scientifiques identifiés et ciblés par le projet : la numérisation de masse, la capacité à gérer de grandes collections de partitions (interrogation) de manière scalable (indexation, optimisation) et la mise au point de méthodes génériques d’analyse.

La numérisation des partitions historiques et la valorisation de leur contenu : vers des bibliothèques numériques musicales intelligentes

Les fonds de partitions constituent une part importante du patrimoine culturel. De tels fonds sont présents chez toutes les grandes bibliothèques patrimoniales comme la Bibliothèque nationale de France. La numérisation, processus de fond engagés par ces institutions, s’est appliquée également au collections de partitions, mais en se limitant à la mise à disposition sous forme d’image dans les outils de diffusion comme Gallica. La nature particulière de la musique notée rend l’accès au contenu des documents difficile pour de non-spécialistes. De plus, les outils de recherche et d’interaction, très spécifiques là encore à la nature du contenu représenté, sont d’une part peu envisageables sur la base d’une image, et d’autre part limités par l’absence de techniques et méthodologies adaptées et suffisamment robustes. Le projet MuNIR s’est attaché à lever ces obstacles en étudiant la numérisation de masse, la capacité à gérer de grandes collections de partitions (interrogation) de manière scalable (indexation, optimisation) et la mise au point de méthodes génériques d’analyse musicologique.

Le projet MuNIR s’appuie sur de nouveaux formats de numérisation de partitions qui ont vu le jour récemment et permettent de représenter très finement le contenu des partitions. Ce contenu est très divers: on y trouve des informations explicites (les notes, les instruments, les accords), des méta-données (auteurs, dates), des instructions d’affichage, ainsi que des informations implicites relatives au langage musical. MuNIR s’est attaché à promouvoir le format de numérisation MEI, à développer les méthodes de passage du format image au format MEI (« optical music recognition », music-encoding.org) et à exploiter ce format. Les briques de base d’un moteur de recherche ont alors été élaborées: langage d’interrogation, structures d’indexation, et extraction de connaissances. Afin de fournir à la communauté SHS la plus concernée par le projet un support et des préconisations, des jeux de données et composants logiciels sont mis à disposition. L’ensemble de ces résultats constitue une avancée significative vers la capacité de mettre à disposition des chercheurs, musiciens et archivistes des outils de recherche et d’analyse performants et passant à l’échelle.

Le projet a étudié les processus de numérisation permettant d’obtenir un codage de la notation musicale à partir des sources multimédia les plus courantes: images et audio. Outre des publications scientifiques sur ces deux sujets, les partenaires du projet ont créé un Workshop annuel, WORMS, dont la première édition s’est tenue au Cnam en 2018 (https://sites.google.com/view/worms2018/home) et dont la troisième aura lieu à Montréal en 2020. Nous avons également produit et mis à disposition de la communauté des jeux de données annotés qui peuvent servir de base d’apprentissage et sont actuellement les plus complets dans le domaine de la musique notée (par opposition avec les documents audios). Enfin des outils Open Source pour la gestion de grandes collections de partitions numérisées sont également produites et soutenues par les partenaires.

Le projet a établi des bases solides pour la modélisation de partitions numérisées et l'extraction de connaissances. Sur ces bases, les travaux à venir les plus importants rélèvent du défi de numérisation à large échelle pour permettre la mise à disposition du très vaste patrimoine existant actuellement sous forme d'images. Les partenaires s'y attacheront dans leurs domaines d'expertise respectifs: la transcription automatique et la reconnaissance optique.

Les deux partenaires sont des contributeurs de l’action Music Encoding Initiative dont la conférence annuelle a été organisée au Québec (à Montréal) sous la direction d’I. Fujinaga en 2016, et en France (à Tours) en 2017, sous la co-direction de P. Rigaux (Cnam) et P. Vendrix (Tours). Nous situons tous nos travaux dans le cadre de la promotion de cette initiative et de son format d’encodage. À ce titre nous avons publié dans toutes les conférences spécialisées (TENOR, ISMIR, DLFM, MCM). Le langage d’interrogation défini dans le projet a fait l’objet d’une publication dans une principale revue généraliste en informatique, Information Systems. Enfin les deux partenaires se sont attachés à contribuer aux outils logiciels et à leur diffusion via GitHub, Docker, leurs plate-forme respectives, NEUMA et SIMSSA [F19], et la suite logicielle Music21 (https://web.mit.edu/music21/).

Le projet MuNIR a pour objectif de contribuer à la recherche en SHS,
dans le domaine de l'analyse et de la recherche d'information, pour les chercheurs
travaillant sur la notation musical, le patrimoine de la musique notée, et l'analyse
historique du langage musical.

Nous nous proposons de mener une recherche consacrée aux méthodes de recherche et
d'analyse portant sur la numérisation de la notation musicale (les partitions),
aux jeux de données et aux outils démontrant l'impact pratique de notre
travail. Le project cherchera à répondre à deux questions étroitement associées:

1) Etant donné une grande collection de partitions numérisées, comment l'organiser
pour rendre son accès plus rapide et plus facile? Comment trouver et mettre
en valeur la structure et les principes du langage musical implicitement codé
dans la notation? Quelles sont les méthodes et les outils pour extraire et
communiquer de la connaissance à partir de partitions volumineuses et complexes?
2) Comment rendre les résultats de nos recherches pratiquement utilisables
par la communauté SHS, en leur permettant de valoriser leurs collections et leurs
études sur le patrimoine musical?

Pour répondre à la première question, nous développerons une activité de recherche
concentrée sur les méthodes de recherche d'information et de fouille de données.:
algorithmes, structures d'index, production de descripteurs superficiels
ou profonds pour comparer des partitions, les regrouper, identifier des motifs
caractéristiques ou récurrents. Ce premier axe sera complété par un effort de développement
et de valorisation. Nous concevrons une architecture de référence pour la conception
de plate-forme d'analyse et de recherche dédiées aux partitions numérisées,
et diffuserons des composants logiciels facilitant la mise en œuvre
de tels systèmes.

Coordination du projet

Philippe Rigaux (Conservatoire National des Arts et Métiers)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

CNAM Conservatoire National des Arts et Métiers
McGill McGill University

Aide de l'ANR 211 255 euros
Début et durée du projet scientifique : décembre 2016 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter