Décomposition en Eléments Sonores et Applications Musicales – DESAM
Ce projet s'inscrit dans le champ de l'indexation automatique et du traitement des données audiofréquences et, en particulier, de la musique. Le volume considérable des données multimédia actuellement disponibles et sa croissance rapide en rendent l'accès difficile et suscitent des besoins pour de nouvelles méthodes efficaces d'indexation, de classification et d'accès par le contenu. Appliquée aux signaux musicaux, l'indexation automatique vise à extraire des descripteurs permettant de déterminer, par exemple, la partition originale, le genre du morceau, le style de jeu de l'artiste, ou une signature de l'oeuvre. Néanmoins, si des résultats prometteurs ont déjà été obtenus dans de nombreux domaines de l'indexation de signaux audio, il existe toujours un fossé important à combler pour obtenir des performances suffisantes qui autoriseraient bonne représentation de l'information musicale. L'objectif de ce projet est de mettre en œuvre des méthodes innovantes d'analyse et de représentation pour décomposer les signaux de musique en éléments sonores adaptés à l'objet étudié d'une part et à l'application visée d'autre part. Le champ d'applications est multidisciplinaire : physique (analyse des mécanismes de production des sons), traitement et stockage de l'information (codage audio), et post-production multimédia (effets sonores, modifications d'échelles temporelle et fréquentielle ou de timbre). Notre activité s'appuiera essentiellement sur deux axes de recherche. Le premier porte sur des techniques d'analyse temps-fréquence du signal, dérivées des méthodes d'estimation spectrale dites à haute résolution. Ces méthodes à haute résolution sont aujourd'hui encore très peu utilisées dans le domaine du traitement des signaux audio et des signaux de musique. Pourtant, elles présentent un potentiel important dans ce domaine, puisqu'elles permettent de s'affranchir de la limite de résolution spectrale liée à l'utilisation de la transformée de Fourier. Le deuxième axe de recherche s'inscrit dans le cadre des représentations parcimonieuses. Il portera sur la construction automatique d'un dictionnaire d'éléments sonores adaptés au signal audio. Cette approche conjointe fournit une représentation du signal en somme d'entités plus élémentaires. A partir de ses entités, des descripteurs de haut niveau seront extraits pour alimenter des systèmes de reconnaissances d'instrument, d'estimation du rythme et d'estimation de hauteurs multiples pour aller vers un transcripteur automatique. Ces tâches seront alors associées au problème de la séparation des sources sonores dans un enregistrement mono ou stéréo de musique polyphonique. Par ailleurs, la précision de la décomposition permet d'une part une étude des mécanismes de production du son dans les instruments et d'autre part un codage plus efficace des sons autorisant de plus des possibilités de modifications et d'effets sonores.
Coordination du projet
CNRS DELEGATION REGIONALE PARIS A (Divers public)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
CNRS DELEGATION REGIONALE PARIS A
Aide de l'ANR 121 900 euros
Début et durée du projet scientifique :
- 36 Mois