JCJC - Programme "Jeunes chercheuses et jeunes chercheurs" 2006

– ATLAS

Résumé de soumission

Ce projet se situe à la croisée des chemins de la statistique adaptative (fonctionnelle) et de l'apprentissage. Leur but commun est de proposer des méthodes d'inférence statistique optimales quand très peu de choses sont connues sur les objets cibles : ces méthodes sont sensées s'adapter aux caractéristiques inconnues de l'objet. Une fois bien calibrées, ces méthodes ont un bon potentiel d'utilisation pratique, puisqu'elles ont justement été produites pour ne demander aucune connaissance a priori sur les données à traiter. Les domaines et techniques mathématiques mis en jeu ou auxquels les méthodes s'appliquent sont cependant très vastes ; on peut citer, par exemple, la concentration de la mesure, les problèmes minimax, la théorie des jeux, ainsi que les applications pratiques visées : répartition des mots sur l'ADN, pharmacologie, étude de données fonctionnelles issues de l'industrie agro-alimentaire, prévision de la qualité de l'air. Des améliorations dans chacun de ces domaines ont des répercussions dans tous les autres. En particulier, les applications visées ici sont à l'origine de nombreuses questions en statistiques théoriques, en concentration de la mesure, et en théorie des jeux. OBJECTIFS A/ Permettre la diffusion des connaissances et des questions soulevées depuis les applications jusqu'à la théorie, et réciproquement. B/ Aboutir à des méthodes justifiées théoriquement et qui ont de réelles applications pratiques. C/ Si possible, implémenter ces méthodes dans des logiciels qui les rendraient accessibles au plus grand nombre d'utilisateurs. RESULTATS ATTENDUS A/ Pouvoir estimer les distances favorisées ou évitées entre mots sur l'ADN. Si possible, pouvoir tester qu'une telle interaction existe ou non. B/ Pouvoir tester l'homogénéité de la répartition des globules blancs dans des échantillons étudiés au microscope. C/ Pouvoir classifier de manière rigoureuse des données fonctionnelles comme celles issues de l'industrie agro-alimentaire. En particulier, interpréter de manière précise les résultats. D/ Pouvoir combiner efficacement et séquentiellement différents modèles de prévision de la qualité de l'air pour obtenir un modèle plus efficace que chacun des modèles pris séparément. METHODOLOGIE A/ Améliorer ou construire des inégalités de concentration de la mesure dans les différents domaines concernés pour préciser des résultats de types loi des grands nombres ou théorème ergodique. B/ Construire des méthodes adaptatives utilisant ces inégalités pour trouver la bonne pénalité à utiliser en sélection de modèle ou en classification, le bon seuillage, etc. ou pour traiter, le cas échéant, une éventuelle contrainte séquentielle. C/ Rechercher des ensembles d'objets décrits théoriquement pour lesquels on calculera des bornes inférieures pour les risques (ou gains) minimax. D/ Comparer nos méthodes à ces bornes pour prouver leur adaptation théorique. E/ Tester nos méthodes en pratique et si elles ne fonctionnent que partiellement, essayer de reprendre depuis A/ la méthode en vue d'une amélioration.

Coordination du projet

Organisme de recherche

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

Aide de l'ANR 110 000 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter