CE23 - Intelligence Artificielle

Création éthique de données textuelles artificielles : Synthèse Automatique de documents Hospitaliers – CODEINE

Résumé de soumission

L'apprentissage automatique est un levier important des technologies du langage nécessitant des corpus annotés pour entraîner et évaluer des modèles. Le projet CoDeinE propose de pallier le manque de corpus partageables dans des domaines sensibles (santé, finance...). Le projet est centré sur la définition de méthodes de génération de paraphrases et leur application à des corpus confidentiels pour produire automatiquement des textes synthétiques anonymes comparables à des documents réels d’un point de vue linguistique. Le projet se positionne dans le champ du traitement automatique de la langue mais englobe aussi la définition de critères de confidentialité garantissant l’absence d’information confidentielle originelle dans les textes synthétiques produits. Notre cas d'étude sera celui de documents cliniques présents dans les dossiers électroniques patient. Le projet s'appuiera sur la ludification et les sciences participatives pour valider puis annoter les textes synthétisés.

Coordination du projet

Aurélie Névéol (Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LORIA Laboratoire lorrain de recherche en informatique et ses applications (LORIA)
LIMSI Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur
LIST Laboratoire d'Intégration des Systèmes et des Technologies
CRC CENTRE DE RECHERCHE DES CORDELIERS

Aide de l'ANR 558 771 euros
Début et durée du projet scientifique : mars 2021 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter