JCJC - Jeunes chercheuses et jeunes chercheurs

– PROGNOSTIC

Résumé de soumission

Dans ce projet, nous proposons de réunir une équipe de jeunes chercheurs afin de développer l'inférence statistique des processus de comptage dépendant de marques. Nous pensons en effet que l'inférence pour de tels modèles n'a pas totalement bénéficié des avancées récentes en statistiques, comme la théorie de l'apprentissage statistique et la statistique en grande dimension par exemple. Nous proposons donc d'obtenir de tels développement, avec l'objectif d'approcher (voir d'atteindre) l'état de l'art du modèle de régression, par exemple. En effet, un fait étonnant est que, malgré l'importance de ce modèle dans de nombreux problèmes, en particulier en médecine (voir plus bas), en économétrie et en actuariat, il existe des jeux de données pour lesquels il n'existe pas encore de méthodes appropriées pour les étudier. Les données en grande dimension dans ce modèle est le premier exemple qui vient à l'esprit. C'est pourquoi nous pensons que le développement de méthodes pour ce modèle est très importante, et c'est ce que nous proposons de faire dans ce projet. Beaucoup de statistiques mathématiques sont impliquées, et nous pensons que ce projet donnera lieu a de nombreuses publications dans ce domaine (le projet est décomposé en 19 sous-tâches, chaque tache donnera lieu à au moins une publication). L'équipe est constituée de 11 chercheurs. Leurs spécialités sont variées: statistiques pour les processus de comptage et données de survie [A. Guilloux, responsable du projet (LSTA-UPMC et CRSA-E13-UPMC), S. Geffray (U. Nantes), P. Saint-Pierre (LSTA - UPMC)], statistiques non-paramétrique et apprentissage statistique [S. Gaïffas (LSTA-UPMC), G. Lecué (CMI-U. Provence), G. Biau (LSTA - UPMC)], statistiques non-paramétrique et réduction de la dimension [O. Lopez (LSTA - UPMC), O. Bouaziz (LSTA - UPMC)], statistiques en grande dimension [E. Roquain (LPMA-UPMC), F. Villers (LPMA-UPMC)] et cancérologie [A. Duval (CRSA-E13-INSERM,UPMC)]. Les collaborations existantes entre les membres de l'équipe forment une base sur laquelle ce projet est construit. Le projet trouve ses origines, du point du vue appliqué, dans des collaborations (continuées) entre A. Guilloux et A. Duval, sur des études statistiques cherchant à déterminer si l'état muté d'un certain gène a une influence sur l'efficacité d'une chimiothérapie chez des patients traités pour un cancer collorectal. Du point de vue théorique, les bases du projet sont liées à des résultats obtenus par A. Guilloux et S. Gaïffas sur la sélection de modèle et sur l'apprentissage statistique dans des modèles de processus de comptage. Ces résultats démontrent la possibilité d'obtenir des stratégies statistiques récentes pour ces modèles. Nous avons décomposé le développement de telles méthodes en 6 tâches principales: inférence pour des processus de comptage par sélection de modèle (1), apprentissage statistique (2), réduction de la dimension par une approche du type single-index (3), statistiques en grande dimension (4). Nous allons également étudier d'autres cadres d'estimation (5), d'importance en pratique : les événements récurrents, les modèles semi-markoviens, etc. Des développement parallèles, conçernant la théorie de l'apprentissage statistique et la théorie du processus empirique, directement utile pour le projet, seront étudiés (6). En parallèle, les collaborations déjà existantes au sein de l'équipe entre statistiques, médecine et biologie seront continuées. Nous pensons que cela aboutira au développement d'outils informatiques pouvant être utilisé par des praticiens, et capables de répondre à leurs questions médicales et biologiques. En effet, grâce à la collaboration entre l'équipe CRSA-E13 (INSERM-UPMC, directeur: A Duval), la Ligue contre le Cancer et l'Institut National contre le Cancer, nous avons déjà à notre disposition des jeux de données difficiles à analyser en l'état actuel des connaissances. Il s'agit des profils transcriptomiques (l'altérations dans l'expression des gênes) pour environ 2000 gènes de tumeurs collorectales chez 120 patients, pour lesquels les oberservations des temps de rémission (données de survie) et d'autres variables cliniques et biologiques sont disponibles. Au jour d'aujourdhui, il n'existe pas de méthodologie statistique capable de déterminer l'influence de chaque gène sur les temps de rémission de ces patients. C'est ce qui a donné le nom du projet : PROGNOSTIC.

Coordinateur du projet

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Aide de l'ANR 0 euros
Début et durée du projet scientifique : - 0 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter