Programme Prioritaire de Recherche Maladies rares: accélérer la recherche et l'innovation grâce aux bases de donnée

CDE.AI: Artificial Intelligence at the service of common data elements for rare diseases

CDE.AI

Mots-clés : Banque Nationale De Données Maladies Rares, Database complication des glucocorticoides, Set de données minimum maladies rares, Traitement Automatique des Langues (TAL / NLP / LLMs), IA en environnement sécurisé, IA sur dossiers patients électroniques

Résumé

CDE.AI collecte 2 bases de données, par remplissage automatique de 2 formulaires, directement depuis des comptes rendus médicaux en texte libre (CRs) :

 

-le formulaire des Common Data Elements Maladies Rares (RD-CDE) de la Banque Nationale Des Maladies Rares (BNDMR), outil de collecte du plan national des maladies rares (PNMR).

 

- un formulaire de recherche sur les glucocorticoides (GC-CDE), qui évalue l’exposition et les complications dans leurs relations temporelles.

 

CDE.AI doit traiter 10000 CRs (CNIL 2024) de 3 filières maladies rares (FIRENDO, FILNEMUS et FAI2R ; Paris, Lyon et Marseille). Un pipeline de collecte et de pseudonymisation des CRs a été créé 2025. 791 CRs ont été téléversés dans France Cohortes (FC). Une sous-cohorte prospective de 300 patients bénéficiera d’analyses multi-omiques et d’une évaluation de l’acceptabilité de l’outil (CPP janvier 2026).

 

Le traitement des CRs était prévu à base de règles et des modèles par apprentissage supervisé. Les grands modèles de langage (LLMs), apparus après le début du projet, ont été inclus. Cependant utiliser des LLMs dans un environnement fermé (FC) sur des données critiques (CRs) reste exceptionnel en Europe. CDE.AI ouvre cette voie (implémentation novembre 2025).

 

Avec ces nouveaux outils, CDE.AI a extrait 40 variables RD-CDE et GC-CDE (règles et/ou promptings), avec des résultats probants. CDE.AI vise des gains majeurs en terme de complétude, de qualité et surtout de temps de saisie des données. Ces gains sont essentiels pour la recherche et le monitorage sur les Maladies Rares (objectif du 4ème PNMR).

 

CDE.AI exploite la capacité des LLMs à capturer de données complexes à partir des CRs : les relations temporelles (article soumis 2025 JMIR DOI: 10.2196/preprints.95198), et les informations globales. Ces données complexes dans une base de milliers de patients ouvrent l’exploration de «la part» des glucocorticoïdes dans les complications (HTA, diabète, surpoids).

 

Les objectifs scientifiques sont inchangés, les délais et engagements tenus. Nous espérons pouvoir poursuivre et terminer ce projet, qui ouvre une voie majeure pour l’implémentation en vie réelle de la collection des données cliniques pour le pilotage et la recherche sur les maladies rares à l’ère de l’IA.

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Informations générales

Acronyme projet : CDE.AI
Référence projet : 21-PMRB-0002
Région du projet : Île-de-France
Discipline : 5 - Bio Med
Aide PIA : 1 335 930 €
Début projet : juin 2022
Fin projet : juin 2028

Coordination du projet : Guillaume ASSIE
Email : guillaume.assie@aphp.fr

Consortium du projet

Etablissement coordinateur : AP-HP
Partenariat : Sorbonne Université, Fondation IMAGINE, Hospices Civils de Lyon, Centre Hospitalier Régionale de Marseille (Assistance Publique-Hôpitaux Marseille), INSERM Délégation Paris IDF Centre-Nord, Université Paris Cité

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter