CE23 - Données, Connaissances, Big data, Contenus multimédias, Intelligence Artificielle

QualiHealth: Amélioration de la Qualité des Données de Soins – QualiHealth

Résumé de soumission

Les activités des établissements hospitaliers comme les activités de recherche
scientifique des instituts de sciences de la vie produisent quotidiennement
une quantité d’information considérable. Ces données sont précieuses pour
améliorer la qualité des soins et peuvent jouer un rôle essentiel en
recherche clinique. Cependant, la collecte de telles données est souvent
réalisée par des outils variés et des processus d’acquisition de données
aux degrés de fiabilité variables. Les données, qui se trouvent ainsi
dispersées dans des sources hétérogènes, souffrent de problèmes aigus de
qualité qui nuisent à leur exploitation à des fins de recherche.

Les problèmes classiques de qualité, comme les données erronées ou
manquantes, sont observables mais d’autres problèmes plus subtils
surgissent lors de l’intégration, notamment quand un nouvel usage est visé
dans un contexte autre que celui initialement prévu. De plus, les
distributions statistiques des données peuvent évoluer dans le temps, ce
qui conduit à la présence d'aberrations (data-glitches) qui peuvent induire
de graves erreurs d’interprétation.

A ce jour, aucun système n’est capable d’assister les cliniciens et les
chercheurs dans leurs activités en prenant en compte la qualité des
données. L’absence d’indicateurs de qualité limite considérablement
l’exploitation des données de santé pour la recherche translationnelle.
Nous soutenons que des analyses bien plus riches et des interactions bien
plus fertiles entre recherche clinique et pré-clinique seraient possibles
si les données disponibles étaient annotées par des indicateurs de qualité
qui seraient ensuite exploités lors de l'interrogation et l’analyse des
données existantes.

Ce projet vise à concevoir un système capable de capturer et de formaliser
les pratiques et les connaissances des experts du domaine médical en
matière de qualité des données, afin d’enrichir les données existantes avec
des annotations et d’exploiter cette connaissance lors de l’interrogation
et l’analyse de données.

Un tel système permettra de gérer des données médicales et biologiques dont
la qualité sera certifiée et dont la qualité des résultats des requêtes
sera également certifié. Pour cela, nous visons la conception et la
réalisation d’un moteur d’évaluation de requêtes capable d’enrichir les
requêtes exprimées par ses utilisateurs pour y répondre en prenant en
compte des indicateurs de qualité. La réalisation de cet objectif ambitieux
s’appuie sur les éléments suivants :
une approche fondée sur les données concrètes, les pratiques et la
connaissance des experts sera menée pour identifier, formaliser, vérifier
et construire des indicateurs de qualité capables de capturer la variété
et la complexité des données;
ces indicateurs seront composés, normalisés et agrégés pour répondre aux
requêtes impliquant différentes granularités (ex., l’agrégation
d’indicateurs individuels lors d’une requête qui porte sur une cohorte) ou
des indicateurs différents (ex., une requête qui croise des données
incomplètes avec des données imprécises)
ces indicateurs complexes seront exploités pour développer de nouvelles
méthodes pour répondre, raffiner et enrichir les requêtes et calculer
leurs réponses. Le caractère novateur de l’approche consiste à s’affranchir
de la phase de nettoyage de données et à intégrer la prise en compte de la
qualité des données dans le processus d'interrogation, en reformulant et en
étendant automatiquement les requêtes posées.

La pertinence de la specification déclarative des indicateurs de
qualité proposés, l’efficacité du processus de reformulation intégré aux
algorithmes d’évaluation de requêtes et l'analytique guidée par les indicateurs seront évaluées par des experts du
domaine sur des données réelles et représentatives, collectées par le
consortium.

Coordinateur du projet

UMR 5205 - LABORATOIRE D'INFORMATIQUE EN IMAGE ET SYSTEMES D'INFORMATION (Laboratoire public)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

UMR 5205 - LABORATOIRE D'INFORMATIQUE EN IMAGE ET SYSTEMES D'INFORMATION
Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes
CENTRE DE RECHERCHE DES CORDELIERS
Institut Cochin
MAAT FRANCE
Laboratoire d'Informatique et Systèmes
University of British Columbia / Department of Computer Science

Aide de l'ANR 744 591 euros
Début et durée du projet scientifique : janvier 2019 - 48 Mois

Liens utiles