DS0707 - Interactions humain-machine, objets connectés, contenus numériques, données massives et connaissance

Modélisation et résolution de requêtes ontologiques sur des données médicales semi-structurées – GoAsQ

Résumé de soumission


De plus en plus d'informations numériques sur des entités (par exemple, des personnes, des événements, des entités biologiques) sont disponibles sous forme structurées (des bases de données) ou semi-structurées (des textes) et leur recherche repose sur la formulation de critères de sélection. Retrouver automatiquement les entités qui répondent à des critères de sélection a amené à proposer des systèmes de recherche dans ces diverses bases de connaissances. Alors qu'une requête simple peut être formulée par un ensemble de mots-clés, il est nécessaire d'envisager des formes de questions complexes pour pouvoir exprimer des critères de sélection riches. Ces questions complexes qui peuvent exprimer des informations de typage et de relations entre des entités, permettent d'augmenter la précision des résultats de la recherche, et par conséquent de réduire les efforts de vérification manuelle des résultats. Un exemple de ce type de besoin est, dans des dossiers médicaux électroniques, la recherche de patients qui répondent à une combinaison non triviale de certaines propriétés, telles que des critères de qualification définis pour un essai clinique. Un autre exemple est le cas où un étudiant pose des questions à un service universitaire sur des dispositions en matière de cours et de contrôle. C'est pourquoi de nombreux travaux ont été développés pour répondre à des questions exprimées en langue naturelle sur des textes et des données structurées.

Dans le projet GoAsq, nous envisageons la comparaisons et la combinaison de deux approches pour répondre à des questions exprimées en langage naturel sur des données textuelles, semi-structurées, ou structurées. L'une est de répondre aux questions en se fondant sur les textes et de rechercher des réponses aux questions en langue naturelle en utilisant des techniques du traitement du language naturel et de la recherche d'information sémantique. L'autre approche est d'essayer de transformer les questions en language naturel en requêtes formelles pour interroger des bases de données. Une traduction automatique est nécessaire parce qu'il est difficile pour les utilisateurs (par exemple, docteurs, étudiants) de formaliser leurs besoins en requêtes formelles. La définition d'une ontologie pour accéder aux données de la base permet de surmonter le décalage sémantique possible entre les experts qui fournissent les données (par exemple, des médecins qui produisent les notes cliniques) et les personnes qui utilisent le système (par exemple, les chercheurs qui formulent des essais cliniques). GoAsq va se fonder sur les avancées les plus récentes dans le domaine des ontologies pour l'accès aux données, nommé interrogation à base d'ontologie (OBQA). Plus précisément, dans la tâche 1 du projet, nous envisageons les deux cas d'utilisation mentionné ci-dessus (critères d'éligibilité; la recherche du règlement). Dans la tâche 2, nous allons introduire et analyzer les extensions des languages de requêtes formelles qui sont requis par les cas d'utilisation. La tâche 3 consiste à développer des techniques pour acquérir les requêtes formelles à partir des requêtes textuelles, et la tâche 4 est d'évaluer la méthode obtenue, la comparer avec les approches de réponse aux questions fondées sur les textes, et développer un approche qui combine les avantages des deux.

Coordination du projet

Yue MA (Université Paris Sud/Laboratoire de Recherche en Informatique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

TUD TECHNISCHE UNIVERSITÄT DRESDEN/FACULTY OF COMPUTER SCIENCE
LIMSI Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur
UPSUD/LRI Université Paris Sud/Laboratoire de Recherche en Informatique

Aide de l'ANR 271 133 euros
Début et durée du projet scientifique : novembre 2015 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter