Nicolas Obin - #monANR

Nicolas Obin, chercheur au sein du laboratoire Sciences et technologies de la musique et du son à l’IRCAM

 

Nicolas Obin, chercheur au sein du laboratoire Sciences et technologies de la musique et du son à l’IRCAM : La voix augmentée

Dalida, Jean Cocteau ou Marilyn Monroe. Grâce au travail de Nicolas Obin, il est désormais possible de reconstituer une conversation avec ces trois personnages. Chercheur au sein du laboratoire Sciences et technologies de la musique et du son à l’IRCAM, il obtient en 2017 le financement par l’ANR de son projet TheVoice, qui explore l’utilisation des modèles génératifs d’IA pour manipuler la voix à des fins créatives.

En quoi consiste votre projet de recherche TheVoice, soutenu par l’ANR ?

Je suis spécialisé dans la synthèse vocale et les modèles d’intelligence artificielle générative visant à « apprendre » aux machines à parler. Mon projet, intitulé TheVoice, s’inscrit dans cette perspective. Il s’intéresse à la modélisation de la voix et de son expressivité pour des applications dans les industries créatives et culturelles. Avec l’IRCAM, nous voulions également créer de nouveaux outils d’aide à la création pour les artistes, notamment dans le domaine du cinéma, par exemple changer l’identité vocale d’un acteur, manipuler son expressivité ou son style de parole.

Quelle a été la genèse de ce projet ?

Les artistes sollicitent l’IRCAM depuis sa création aux alentours de 1980. À l’époque, nous étions capables de créer des voix de chanteuses lyriques de manière totalement synthétique, encore aujourd’hui impressionnantes sur des vocalises simples. Dans les années 2000, on nous demandait régulièrement de recréer la voix de personnalités historiques disparues, comme Jean Cocteau, mais nous n’étions pas en mesure de le faire avec l’état des connaissances et les ressources de l’époque. En 2012, nous avons eu un premier projet avec l’artiste Philippe Parreno pour son court-métrage Marilyn, dans lequel nous sommes parvenus à recréer la voix de l’actrice par hybridation de la voix d’une comédienne enregistrée et d’outils de manipulation vocale. Cela demandait toutefois énormément de travail manuel. Le projet TheVoice a été pour moi fondateur, m’offrant des moyens de recherche approfondis pour la conception des premiers réseaux de neurones profonds appliqués au codage et à la transformation de la voix.

Quel impact ce projet peut-il avoir sur la société ?

Le potentiel de ces recherches est très important pour la création sonore et les industries culturelles et créatives. Un moment clé de ce projet a été la collaboration avec Thierry Ardisson pour son émission L’Hôtel du Temps, où nous avons recréé la voix de la chanteuse et actrice Dalida. On nous sollicite désormais régulièrement pour recréer la voix de personnalités historiques, ce qui pose des questions évidentes liées à l’éthique, au droit à l’image et au droit d’auteur. Si la simulation d’une identité vocale est sans conteste spectaculaire, il ne s’agit que d’une première étape vers une meilleure compréhension de la voix et de la communication chez l’humain. La simulation est, selon moi, un moyen d’accès à la compréhension, et la compréhension une nécessité pour la maitrise des outils, en particulier pour des applications créatives. Les applications possibles sont diverses pour la manipulation de la voix et l’augmentation de ses capacités expressives, que ce soit en postproduction au cinéma, dans la restauration d’archives historiques ou encore dans la création de voix dépassant les capacités humaines. Nous explorons, par exemple, la possibilité de concevoir des voix chantées avec une tessiture ou une technique au-delà des limites physiques d’un être humain.

Et sur votre trajectoire professionnelle, quel rôle a joué l’ANR ?

Huit ans après la fin du projet, je peux dire qu’il a constitué un jalon et un tremplin dans ma carrière. Il m’a permis de développer un réseau de collaborations avec des laboratoires et des industriels, en France et à l’international, sur le plan académique et dans le secteur culturel.

L’ANR fête ses 20 ans : que lui souhaitez-vous pour les 20 années à venir ?

Longue vie à l’ANR ! Dans une période de l’Histoire où la science est mise à mal, l’ANR joue un rôle essentiel pour soutenir la recherche et les missions scientifiques dans toutes les disciplines. En ce qui me concerne, mon domaine se situe à l’interface des sciences informatiques et d’un objet fondamentalement humain : la voix. Il entre donc en résonance avec les sciences humaines et sociales. Favoriser et dynamiser l’interdisciplinarité et l’originalité des recherches me semblent être des axes fondamentaux de développement futur pour l’ANR. Je souhaite que TheVoice constitue un modèle ou un précédent dans ce sens.

En savoir plus

Projet TheVoice – Design de voix pour l’industrie créative

x
Sign up for the latest news:
Subscribe to our newsletter