
CDE.AI: Artificial Intelligence at the service of common data elements for rare diseases
CDE.AI
Mots-clés : Maladies rares, Traitement automatique du langage, complications des glucocorticoïdes, set de données minimales maladies rares
La BNDMR (Base de Données Maladies Rares) évalue la prise en charge des maladies rares, en collectant un Set de Données Minimales (Rare Disease Common Data Elements /RD-CDE en anglais). Le RD-CDE est colligé manuellement.
Les outils de traitement automatique du langage (TAL) progressent rapidement.
Notre objectif est de créer CDE.ai, basé sur le TAL pour remplir les formulaires de collecte du CDE, directement à partir de dossiers des patients. Deux collectes sont effectuées:
1. Une avec le RD-CDE, visant à améliorer la collecte pour la BNDMR.
2. Une avec un CDE des complications glucocorticoïdes (GC-CDE), visant à créer une base de recherche.
Les dossiers médicaux (10 000 patients) sont utilisés pour entraîner et évaluer CDE.ai. Un large spectre de maladies est couvert, principalement des auto-immunes et auto-inflammatoires rares -avec des patients traités par glucocorticoïdes - provenant des filières maladies rares FAI2R, et FILNEMUS, et des maladies endocriniennes rares –avec des patients en excès de glucocorticoïdes endogènes- de la filière FIRENDO. Pour tous ces patients, CDE.ai sera utilisé pour collecter le RD-CDE pour la BNDMR. Ces patients inclueront
2000 patients avec excès de glucocorticoïdes , dont les compte-renduss serviront à collecter le GC-CDE vers une base de données des complications des glucocorticoïdes. Une biobanque (sang et urinaire) sera constituée pour 300 patients (sous-cohorte, pour mesurer des marqueurs moléculaires connus pourêtre associés à la sensibilité aux glucocorticoïdes, à la recherche de marqueurs prédictifs.
La validation de CDE.ai sera effectuée à trois niveaux:
-performance du TAL
-gain de temps pour les cliniciens.
-l'avis des patients sur le type de données extraites.
La capture semi-automatisée des données par CDE.ai devrait renforcer l'exhaustivité et l'exactitude de la BNDMR. La collecte du GC-CDE conduira à la première grande base sur les complications glucocorticoïdes, et la corrélation avec les marqueurs moléculaires permettra de mieux prédire ces complications.
Le défit principal est la conformité règlementaire et technique de l'implémentation des puissants outils de TAL sur des comptes-rendus de patients. En 2024, l'autorisation CNIL a été obtenue, et le circuit de données conforme mis en place.
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Informations générales
Acronyme projet : CDE.AI
Référence projet : 21-PMRB-0002
Région du projet : Île-de-France
Discipline : 5 - Bio Med
Aide PIA : 1 335 930 €
Début projet : June 2022
Fin projet : June 2028
Coordination du projet : Guillaume ASSIE
Email : guillaume.assie@aphp.fr
Consortium du projet
Etablissement coordinateur : AP-HP
Partenaire(s) : Sorbonne Université, Fondation IMAGINE, Hospices Civils de Lyon, Centre Hospitalier Régionale de Marseille (Assistance Publique-Hôpitaux Marseille), INSERM Délégation Paris IDF Centre-Nord (Paris 5), Université Paris Cité