Désenchevêtrement d'attributs multiples, acoustic et sémantique pour la privacité. – SpeechPrivacy
Telles qu'elles sont définies par le règlement général sur la protection des données (RGPD), les données vocales entrent dans le cadre des données à caractère personnel. Son utilisation dans les applications est en outre considérée comme présentant un risque élevé dans la future « AI act ». En effet, les enregistrements de la parole contiennent bien plus que le contenu parlé (mots), mais aussi, par exemple, l'identité du locuteur, son sexe, son âge, son accent régional, etc. Toutes ces informations personnelles et privées peuvent potentiellement être estimées à partir des données vocales et utilisées à des fins malveillantes ou non désirées. Des technologies pour améliorer la privacité sont nécessaires, pour les utilisateurs de technologies vocales afin d'empêcher l'utilisation de leur enregistrements vocaux à des fins pour lesquelles l'utilisateur n'a pas donné son consentement.
La protection de la vie privée en ce qui concerne les données vocales est encore sous-développée en raison de nombreux défis. Le projet SpeechPrivacy envisage une approche qui va bien au-delà des solutions existantes, en permettant de diminuer la nécessité de faire confiance aux fournisseurs de services vocaux, en donnant à l'utilisateur le contrôle total de sa confidentialité. Ainsi l’utilisateur ou l’utilisatrice pourra choisir quels attributs (sensibles du point de vue de la confidentialité) il ou elle pourra de donner accès au fournisseur de services. SpeechPrivacy offrira une solution flexible pour la préservation de la vie privée, basée sur des représentations isolées/désenchevêtrées et sur l'obfuscation d'attributs sélectionnés. Les scénarios d'utilisation sont multiples : protection de témoins, préservation de la vie privée des adolescents ou adolescentes en ligne et dans les médias sociaux, stockage d'enregistrements de données médicales (en supprimant les informations personnelles du patient ou de la patiente et en préservant la qualité du signal pour un accès à la recherche).
Les objectifs de SpeechPrivacy sont de proposer (1) des solutions spécifiques et optimisées pour dissocier l'âge, le sexe, l'identité vocale et les accents régionaux, entre autres attributs de la parole ; (2) une solution capable de désenchevêtrer plusieurs attributs, comprenant ceux mentionnés en (1), et d'évaluer l'impact de leur obfuscation sur d'autres attributs ainsi que de l’utilité du signal résultant sur les cas d'utilisation donnés ; (3) une solution pour la détection robuste des mots sensibles ainsi que des informations sur l'âge/le sexe du locuteur ou de la locutrice dans le contenu linguistique, afin de les remplacer dans le signal vocal ; (4) une interface utilisateur pour donner aux utilisateurs et utilisatrices un contrôle total sur le compromis vie privée/utilité du signal résultant.
La recherche est organisée en plusieurs tâches distincts afin d'atteindre nos objectifs. Dans un premier temps, nous développerons des solutions pour obfusquer des attributs vocaux spécifiques et uniques, dans le cadre d'une approche de modélisation "un-contre-tous". Nous étendrons ensuite ce travail à la prise en compte d'attributs multiples et à leur désenchevêtrement, à l’aide d’un apprentissage conjoint et adversaire. Nous développerons un cadre dans lequel des attributs distincts sont explicitement modélisés par des dimensions spécifiques dans une représentation commune qui permettra d'obfusquer simultanément plusieurs attributs sélectionnés. La troisième tâche concernera la confidentialité sémantique et abordera la protection des entités nommées sensibles, des attributs d'âge et de sexe dans le contenu linguistique et leur obfuscation dans le signal acoustique. Enfin, la conception de bases de données, de protocoles et de mesures, commune à toutes les tâches, sera étudiée dans une quatrième tâche avec des activités de démonstration conçues pour assurer la diffusion et l'impact au niveau international.
Coordination du projet
Vincent COLOTTE (Laboratoire lorrain de recherche en informatique et ses applications)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
LORIA Laboratoire lorrain de recherche en informatique et ses applications
LIA Laboratoire d'Informatique d'Avignon
EURECOM EURECOM
Aide de l'ANR 732 726 euros
Début et durée du projet scientifique :
janvier 2024
- 48 Mois