Compréhension Automatique de Textes Biomédicaux pour la Recherche Translationnelle. – CABeRneT
Dans le domaine biomédical, les informations cliniques et institutionnelles sont contenues dans le texte de publications scientifiques ou de dossiers patients et ne sont pas directement accessibles à des fins de traitement automatique. Pour pallier cela, des méthodes de Traitement Automatique de Langue Naturelle (TALN) ont été développées avec succès afin d’extraire des informations pertinentes des textes libres et de les convertir en représentations formelles exploitables par l’homme et par la machine. Ce projet propose une analyse qui va au dela de la simple extraction de concepts isolés en permettant d’inclure le contexte d’occurrence ainsi que les relations entre concepts. Par ailleurs, nombre de travaux antérieurs sont limités à l’analyse de textes du domaine biomédical rédigés en anglais. Ce projet participera au nécessaire développement de méthodes permettant d’analyser les dossiers électroniques patient en français afin d’en extraire des représentations formelles compatibles avec celles disponibles pour l’anglais.
Ce projet de recherche se donne pour objectif de:
1. Mettre à disposition de la communauté scientifique des ressources dans un domaine de spécialité (le domaine biomédical) en français
2. Étudier l’adaptation en domaine de spécialité d’outils développés pour la langue générale
3. Appliquer ces outils à l’analyse automatique de dossiers électroniques patient et à la detection de liens entre données cliniques et littérature
Ce projet innovant permettra une analyse fine du contenu des textes du domaine biomedical, et en particuliers les textes cliniques. Il repose sur des principes issus de la linguistique et sera guide par des applications en medicine personnalisée. Une approche globale des problématiques de TAL sous l’angle de l’adaptation permettra d’assurer la portabilité des méthodes utilisées à d’autres applications dans le domaine biomédical.
Coordination du projet
Aurélie Névéol (Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
LIMSI-CNRS Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur
Aide de l'ANR 225 853 euros
Début et durée du projet scientifique :
août 2013
- 48 Mois