CONTINT - Contenus et Interactions

Description,Indexation, Acces aux Documents Ethnomusicologiques et Sonores – DIADEMS

Analyse automatique et navigation au sein d’enregistrements ethnologiques et ethnomusicologiques de la plateforme web Telemeta

Développement d’outils d’analyse pour l’indexation automatique et l’enrichissement d’archives sonores en rapport avec les besoins/objectifs des ethnomusicologues, ethnolinguistes et documentalistes.

Accès par un large public au patrimoine des traditions orales mondiales et partage des connaissances sur l’identification son musical et de la parole

Les archives orales du LESC et du MNHN définissent une collection unique au monde et d’une grande importance historique, regroupant plus de 5000h. Une plateforme web performante et collaborative permet d’en assurer la gestion et le développement d’outils d’analyse du contenu sonore facilite l’accès, l’indexation et les possibilités de navigation dans le son. <br /> <br />L'enjeu est de rendre ce patrimoine mondial immatériel accessible et exploitable scientifiquement. Grâce aux technologies innovantes développées ces dernières années dans le secteur de l'audiovisuel, plus particulièrement dans le traitement du son, il apparaît important de se positionner au niveau international en valorisant concrètement un patrimoine culturel auprès d’un large public, tout en exposant la grande expertise technologique de nos équipes CNRS. D’autre part, dans le contexte européen actuel du partage des données, la mise à disposition de notre patrimoine culturel, par le biais de technologies innovantes, est particulièrement pertinente. <br /> <br />Les pays d'origine de ces enregistrements (en Afrique, Europe, Asie, Amérique…) ont également des attentes légitimes sur un « retour » de leur patrimoine ancestral et souvent en voie de disparition. Ils comptent fortement sur un transfert de technologies pour l'exploitation <br />et la valorisation de ce patrimoine immatériel, qui représente leur identité culturelle, et donc un enjeu important pour les populations. <br /> <br />Le travail de numérisation en cours, long et coûteux, doit être valorisé et ouvert à la consultation afin de bénéficier au plus grand nombre : chercheurs français et étrangers, étudiants, musiciens, mélomanes, minorités culturelles, etc. Les outils informatiques développés par nos spécialistes vont les rendre plus visibles et attractifs tout en répondant aux exigences de la communauté scientifique. La pluridisciplinarité du projet propose des possibilités d’analyse de documents beaucoup plus fine que celles offertes par les outils utilisés jusqu’à présent.

Le projet est l’aboutissement de discussions entre les partenaires des différents domaines visant à identifier des problématiques majeures.

La méthodologie utilisée est la suivante :

1- la réalisation d’outils de type traitement de signal et reconnaissance des formes à des fins de structuration et d’indexation d’un document sonore ou d’une collection de documents. Tout d'abord, les catégories sonores pertinentes à identifier sont définies et caractérisées d’un point de vue acoustique. Ensuite, les segments d'intérêt sont identifiés par les spécialistes. Différents degrés de structuration des outils sont ensuite déclinés : par exemple, avant de reconnaître la présence d’un instrument de musique, il convient de repérer les zones de musique.

2- l’intégration de ces outils sur la plateforme Telemeta. Ce travail revêt deux aspects : l’intégration informatique qui comprend la définition des formats, les spécifications de programmation, mais également la définition et la réalisation de l’interface utilisateur. Celle-ci est définie et réalisée de sorte que les campagnes de calcul puissent être paramétrées et ordonnancées par les utilisateurs depuis leur navigateur web.

3- la validation/évaluation de l’ensemble outils/interface au travers de scénarii. Cette tâche est primordiale car les outils et index n’ont de sens que s’ils répondent aux besoins des utilisateurs et si les catégories d'événements sonores définies et détectées renvoient à des réalités culturelles propres aux enregistrements analysés. Il s'agit de définir les scénarii d'usage en fonction du profil des utilisateurs, de valider systématiquement tout outil d'analyse proposé, à ses différents stades de développement, et de faire appel à des chercheurs spécialisés.

En ethnomusicologie, des catégories d’émission vocale se situant dans un continuum entre parlé et chanté ont été établies et soumises à analyse acoustique afin d’obtenir des descripteurs objectivables.

La majorité des outils d’indexation développés dans le cadre de ce projet a été réuni dans une librairie de plugins (licence GPL). Cette librairie est un module optionnel et complémentaire de la plateforme Timeside qui constitue le moteur d’analyse audio de Telemeta. Elle est mise à disposition librement et publiquement sur la plateforme Github.

Les indexations fournies concernent des bruits techniques spécifiques, la présence de la voix, la distinction entre le parlé et le chanté, le type d’instrument de musique présent, la distinction entre monodie et polyphonie, ainsi que la similarité rythmique entre différents items. Ces outils automatiques sont donc maintenant directement exploitables par tout utilisateur de cette plateforme.

De nombreux corpus ont été valorisés :
• musiques africaines du Muséum (30 bandes magnétiques et 40 cassettes DAT ont été numérisées dans le cadre du projet, soit 800 items).
• les outils ont permis d’indexer de nombreuses collections numérisées par la BNF (3300 items du CNRS-MHS, géré par le CREM-LESC).
• discours rituels mayas du LESC (~50 heures ont été numérisées).

Développement de questions nouvelles posées à l’anthropologie par la confrontation à des outils et méthodes inhabituels : utilisation des archives sonores pour l’étude comparative des patrimoines, définition des catégories scientifiques dans le cadre de plateforme numériques ouvertes à tous...

Ouverture de la communauté scientifique anthropologique au caractère multimodal de la voix et de la parole par des publications/communications à des colloques du réseau mondial des ethnomusicologues (ICTM).

Les outils d’indexation sonore développés dans le cadre de ce projet ont naturellement été présentés lors de congrès et publiés en revue.

Voir rubriques précédentes.

Le projet DIADEMS a donné lieu à la création de 33 livrables. Les travaux pluridisciplinaires ont été nombreux : 11 publications multipartenaires parmi les 34 publications. Plus de 20 communications ont été réalisées autour du projet dans les différentes communautés scientifiques du consortium.

20 livrables logiciels ont ainsi été développés et intégrés à la plateforme Telemeta. Leur utilisation est mise à la disposition de la communauté scientifique. Tout le code source du logiciel étant publié selon les termes de la licence libre GPL ou de l’Affero-GPL, la production de ces outils favorise également l'émergence et l'organisation de communautés de développeurs internes ou externes au projet.

Des présentations et formations dans les laboratoires du CNRS (et autres institutions publiques ayant des fonds sonores et étant fortement intéressés par l’utilisation de la plateforme Telemeta) ont déjà été réalisées.

Le consortium DIADEMS a été à l’initiative de l’organisation de nombreuses manifestations, parmi lesquelles :
ICTM-Colloquium (International Council for Traditional Music) « Between speech and song - liminal utterances » en mai 2015 à Nanterre,
Symposium de l’ICTM « Historical Sources of Traditional Music » en mars 2016 à Paris,
Workshop FMA (Folk Music Analysis), « Analyse de la musique traditionnelle », en juin 2015 à Paris,
Exposition « Explorateurs de Sons » au Musée de l’Homme durant le 1er trimestre 2016.

Le Laboratoire d’Ethnologie et de Sociologie Comparative (LESC) comprenant le Centre de Recherche en Ethnomusicologie (CREM) et le centre d’Enseignement et de Recherche en Ethnologie Amérindienne (EREA) ainsi que le Laboratoire d’Eco-anthropologie du Muséum National d’Histoire Naturelle (MNHN) sont confrontés à la nécessité d’indexer les fonds sonores qu’ils gérent et de faire un repérage des contenus.

Lors de l’Ecole d’Été interdisciplinaire CNRS « Sciences et Voix 2010 », une convergence d’intérêts s’est dégagée entre les acousticiens, les ethnomusicologues et les informaticiens : il existe aujourd’hui des outils d’analyse avancés du son développés par les spécialistes en indexation pour faciliter le repérage, l’accès et l’indexation des contenus.

Le contexte du projet est l’indexation et l’amélioration de l’accès aux fonds d’archives sonores du LESC : le fonds du CREM et celui de l’EREA (« chanté-parlé » Maya), ainsi que celui du MNHN (musique traditionnelle africaine). Dès 2007, aucune application n’existant en « open source » sur le marché pour l’accès aux données sonores de la Recherche, le CREM-LESC, le LAM et la Phonothèque de la MMSH d’Aix-en Provence ont étudié la conception d’un outil innovant et collaboratif qui répond à des besoins « métier » liés à la temporalité du document, et adapté à des exigences du secteur de la recherche. Avec le soutien financier du Très Grand Equipement (TGE) ADONIS du CNRS et du Ministère de la Culture, la plateforme Telemeta développée par la société PARISSON a été mise en ligne en mai 2011 : archives.crem-cnrs.fr.
Sur cette plateforme, des outils élémentaires de traitement de signal sont disponibles. Cependant, il est nécessaire de disposer d’un ensemble d’outils avancés et innovants pour une aide à l’indexation automatique ou semi-automatique de ces données sonores, issues d’enregistrements parfois longs, au contenu très hétérogène et d’une qualité variée.

L’objectif du projet DIADEMS est de fournir certains de ces outils, de les intégrer dans Telemeta, en répondant aux besoins des usagers. Il s’en suit une complémentarité des objectifs scientifiques des différents partenaires :
Les fournisseurs de technologies, l’IRIT, le LIMSI, le LaBRI et le LAM auront à :
o Fournir des technologies existantes telles que la détection de parole, de musique, la structuration en locuteurs. Ces outils visent à extraire des segments homogènes d’intérêt pour l’usager. Ces systèmes auront à faire face à la diversité des bases qu’il est proposé d’étudier dans ce projet ; leur hétérogénéité est liée aux conditions d’enregistrement, au genre et à la nature des documents, à leur origine géographique. Il faudra adapter ces systèmes dits « état de l’art » aux besoins des usagers.
o Proposer des outils innovants d’exploration du contenu de segments homogènes. Les travaux sur l’opposition voix parlée-déclamée-chantée, le chant, les tours de chant, la recherche de similarité musicale ne sont pas matures. Un véritable travail de recherche reste à faire et avoir à sa disposition des musicologues et des ethnomusicologues est un atout positif.

Les ethnomusicologues, ethnolinguistes, acousticiens spécialistes de la voix et les documentalistes spécialisés vont jouer un rôle important dans le projet en tant que futurs utilisateurs des outils d’indexation :
o Les documentalistes doivent s’approprier les outils et apporter leur expérience afin d’adapter ces outils à leur besoin en indexation. Un échange important doit se réaliser entre celui qui fournit l’outil, celui qui l’intègre et celui qui l’utilise. L’effort doit être porté sur la visualisation des résultats avec pour fin une aide forte à l’indexation en la rendant de fait semi-automatique.
o Pour l’ethnomusicologue et le musicologue, l’objectif va au-delà de l’indexation. Il s’agit, au travers d’aller et retour entre lui et les concepteurs de technologies, de cibler les outils pertinents d’extraction d’information.

Coordinateur du projet

Monsieur Julien PINQUIER (Institut de Recherche en Informatique de Toulouse) – pinquier@irit.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

EAE Museum National d'Histoire Naturelle
LAM LAM - Institut Jean le Rond d'Alembert
LIMSI CNRS Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur
PARISSON PARISSON
LaBRI Laboratoire Bordelais de Recherche en Informatique
LESC Laboratoire d’Ethnologie et de Sociologie Comparative
IRIT Institut de Recherche en Informatique de Toulouse

Aide de l'ANR 656 678 euros
Début et durée du projet scientifique : décembre 2012 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter