DS09 - Liberté et sécurité de l’Europe, de ses citoyens et de ses résidents

Comparaison de voix appliquée au domaine criminalistique – VoxCrim

voxCrim : Comparaison de voix appliquée au domaine criminalistique

voxCrim concerne la comparaison de voix dans le domaine criminalistique. L'usage de la voix pour identifier un suspect est une application très demandée mais difficile et controversée.<br />voxCrim vise à créer de la confiance en objectivant les situations dans lesquelles il est possible d'utiliser la comparaison de voix et en explicitant les raisons de ce choix.

Objectiver et certifier le cadre de mise en oeuvre de la compariaosn de voix en criminalistique possibilités d emise en oeuvre

L’objectif premier de voxCrim est de délimiter et objectiver les possibilités de mise en œuvre d’une comparaison de voix dans un cadre criminalistique. <br />Le deuxième objectif est de former experts de la police scientifique et chercheurs académiques aux spécificités du domaine.<br />voxCrim est un projet ouvert qui souhaite produire des ressources accessibles à tous.

Le projet définit le concept de « box-rule », un cadre restrictif dans lequel une comparaison de voix fiable est possible.
Pour cela, il est nécessaire au préalable de renseigner l'espace de variations avec des informations phonétiques reprenant les élements spécifiques du locuteur.
Le projet proposera un outil de mesure objective d el'apprtenance d'un cas réel à une boxrule. Une approche de «representation learning« (deep learning) sera utilisée pour cela.
Le but est d’établir des standards de mesures objectives permettant de mettre en place une méthodologie d’accréditation de type ISO 17025.

Une boite à outil complète inspirée des travaux réalisés pour le projet FABIOLE a été réalisée. Une extension permet de générer automatiquement toutes les expériences de comparaison.
Une base de donnée réalisée dans des conditions proches du monde réel, PTSVox, a été conçue et la première version enregistrée.
Une première étude des informations phonétiques spécifiques du locuteur a été réalisée.

Réalisation de la base de donnée FABIOLE II, permettant des études à grande échelle sur la variabilité intralocuteur
Extention de PTSVox
Réalisation d'une première boxrule, avec le protocole d'accréditation des méthodes associé.

Nautsch, A., Jiménez, A., Treiber, A., Kolberg, J., Jasserand, C., Kindt, E., ..., Bonastre J.-F. & Abdelraheem, M. A. (2019). Preserving Privacy in Speaker and Speech Characterisation. Computer Speech & Language.
Audibert, N., Fougeron, C. (2019). Are people as old as they sound? Acoustic, regional and generational effects. Proceedings of the 3rd Phonetics and Phonology in Europe conference, Lecce, Italy, pp. 49-50.
Ferragne, E., Gendrot, C., & Pellegrini, T. (2019). Towards Phonetic Interpretability in Deep Learning Applied to Voice Comparison. ICPhS, Melbourne.
Gendrot, C., Ferragne, E. & Pellegrini, T. (2019). Deep learning and voice comparison: phonetically-motivated vs. automatically-learned features
Georgeton, L. (2019) Project Voxcrim : Forensic Voice Comparison, IAFPA, Istanbul.
Lapidot, I., Delgado, H., Todisco, M., Evans, N. W., & Bonastre, J. F. (2018). Speech Database and Protocol Validation Using Waveform Entropy. In Interspeech (pp. 2773-2777).
Ajili, M., Bonastre, J. F., & Rossato, S. (2018). Voice Comparison and Rhythm: Behavioral Differences between Target and Non-target Comparisons. Proc. Interspeech 2018, 1061-1065.
Audibert, N., Fougeron, C., Brunot, M., Callé, S., Davallet, I., Lechevalier, N. (2019). Liens entre âge estimé, sévérité de la dysarthrie et intelligibilité des locuteurs. Actes des 8èmes Journées de Phonétique Clinique, Mons, Belgique, pp. 19-22.
Ajili, M., Bonastre, J. F., Waad, B. K., Rossato, S., & Kahn, J. (2018). Comparaison des voix dans le cadre judiciaire: influence du contenu phonétique. Proc. XXXIIe Journées d’Études sur la Parole, 28-36.

VoxCrim concerne l'identification des individus par leur voix dans le domaine criminalistique et, plus exactement, la “comparaison de voix” pour la sécurité nationale et l’expertise judiciaire. Il s’inscrit pleinement dans le Défi 9 et plus précisément dans l’Axe 3. VoxCrim propose un cadre scientifique objectif et validé pour la comparaison de voix, quel que soit le type de méthode employée (automatique ou phonétique). Il propose d’objectiver scientifiquement les possibilités de mise en œuvre d’une comparaison de voix. Ce projet regroupe des spécialistes de l’informatique (LIA), de la phonétique (LPL, LPP) et de la normalisation (LNE) et les représentants des forces de l’ordre (SDPTS). L’IRCGN sera également sollicité comme centre d’expertise. Les objectifs de VoxCrim s’organisent en deux piliers : (1) une exploitation rapide des résultats pour des situations bien contrôlées et (2) un élargissement de l’opérabilité de la méthode à plus long termes. (1) Le premier pilier s’appuie notamment sur les résultats du projet ANR Fabiole. Il en reprend la méthodologie et la base de données et en étend les attendues pour définir le concept novateur de « box-rule », soit un jeu de conditions de mise en œuvre de la comparaison de voix parfaitement défini à l’intérieur duquel une certification est possible. Les outils technologiques et la base de données élaborés au sein de Fabiole seront améliorés, étendues et packagés afin qu’ils soient diffusés aux partenaires du consortium. (2) Le second pilier vise à ajouter des dimensions aux conditions de mise en œuvre de la comparaison de voix. Il s’agit de prendre en compte des caractéristiques de la voix très liées au contexte « terrain » des services de la police, comme l’influence du milieu-socio-culturel et linguistique (langue maternelle, langue familiale…). Pour cela, une base de données (PTSVox) enregistrée par la SDPTS dans une condition micro et une condition GSM a été créée et sera exploitée dans ce projet. La stratégie retenue consiste à développer deux types d’analyses complémentaires : a) une analyse acoustique des productions visant à dégager des indices pertinents pour la caractérisation des voix et b) des expérimentations perceptives visant à évaluer la capacité des auditeurs dans la discrimination des voix. Les analyses acoustiques permettront de délimiter la variabilité inter et intra locuteurs afin de tester la robustesse de ces marqueurs. Les expérimentations perceptives verront, si les descripteurs acoustiques mis précédemment en évidence sont effectivement utilisés par les auditeurs pour identifier les locuteurs, particulièrement pour la parole téléphonique (cas le plus courant dans les affaires de police scientifique) et évalueront les performances d’un auditeur en matière de discrimination de voix. Ce projet permettra à terme aux laboratoires de police technique et scientifique d’adjoindre la comparaison de voix à leur démarche normative de type 17025 des laboratoires de police technique et scientifique. Voxcrim a pour ambition de diffuser les principes et intérêts d’une démarche qualité dans le domaine de la comparaison de voix auprès de la communauté de la parole mais aussi auprès des acteurs du système judiciaire (police, magistrats). Pour cela, des journées thématiques seront organisées pour la dissémination des connaissances et des problématiques traitées auprès du public concerné. De plus, les doctorants et post-doctorants recrutés au sein des laboratoires partenaires feront des stages « pratiques » à la SDPTS et à l’IRCGN pour comprendre les problématiques de ces services opérationnels. VoxCrim formera, ainsi, un large groupe de scientifiques spécialistes de la comparaison de voix dans le domaine criminalistique, palliant ainsi une faiblesse souvent remarquée en France.

Coordination du projet

Jean-François BONASTRE (Laboratoire d'Informatique d'Avignon)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIA Laboratoire d'Informatique d'Avignon
AMU Université d'Aix-Marseille (Laboratoire Parole et Langage)
LPP Laboratoire de Phonétique et Phonologie
LNE Laboratoire national de métrologie et d'essais
SCPTS Service Central de la Police Technique et Scientifique

Aide de l'ANR 717 881 euros
Début et durée du projet scientifique : novembre 2017 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter