JCJC - Jeunes chercheuses et jeunes chercheurs

DETECT: Nouvelles approches statistiques pour la vision artificielle et la bioinformatique – DETECT

Résumé de soumission

Le projet DETECT trouve son origine dans plusieurs problèmes ayant émergé récemment dans les domaines de la vision artificielle et de la bioinformatique et qui rejoignent des problématiques actuelles de la théorie statistique de l'apprentissage. D'une part, comprendre les actions et interactions d'humains dans des vidéos est toujours un problème ouvert en vision artificielle et aurait de nombreuses applications telle que l'annotation automatique de collections de vidéos. D'autre part, les quantités toujours plus importantes de données biologiques disponibles (profils CGH obtenus par séquençage haut-débit, mesures d'expression de gènes ou d'abondance de protéines dans différentes conditions, données de séquençage ADN, etc.) nécessitent de nouveaux outils d'analyse fiables, précis et rapides. Deux problèmes de détection sont au coeur de ces questions: la détection de ruptures (c'est-à-dire partitionner une suite d'observations en segments homogènes) et les tests multiples (c'est-à-dire effectuer simultanément un grand nombre de tests d'hypothèses en contrôlant le nombre de faux positifs). Plus encore, résoudre ces problèmes demande de relever plusieurs défis actuels de la théorie statistique de l'apprentissage, en particulier: développer des algorithmes de détection de ruptures pour des données multivariées structurées, développer des procédures de test multiple s'adaptant automatiquement à une structure de dépendance inconnue et impossible à estimer, développer des méthodes robustes (c'est-à-dire ne fonctionnant pas seulement sous des hypothèses peu réalistes) et comprendre précisément ce que ces algorithmes gagnent en précision lorsqu'on augmente leur temps de calcul. Des interactions fortes, réciproques et à long terme sont donc nécessaires entre les domaines de l'apprentissage statistique, de la vision artificielle et de la bioinformatique. Objectifs: L'objectif général du projet DETECT est de développer de telles interactions autour des problèmes de détection. En contribuant à diffuser les connaissances entre apprentissage statistique, vision artificielle et bioinformatique, nous visons: - en vision artificielle, à reconnaître automatiquement des actions au sein de vidéos; - en bioinformatique, à segmenter de manière robuste des profils CGH multiples, détecter des motifs exceptionnels (c'est-à-dire significativement sur- ou sous-représentés) dans une séquence d'ADN et détecter des gènes (ou groupes de gènes) différentiellemment exprimés parmi des dizaines de milliers à partir de peu d'observations; - en apprentissage statistique, à améliorer la compréhension théorique des méthodes fréquemment utilisées en vision et en bioinformatique, et à proposer de nouveaux algorithmes pour ces problèmes. Programme: Le programme du projet DETECT se décompose en quatre tâches principales. D'une part, deux tâches méthodologiques correspondent aux deux grands types de problèmes identifiés: la détection de ruptures et les tests multiples. D'autre part, les deux grands domaines d'où proviennent ces problèmes, la vision artificielle et la bioinformatique, font l'objet d'une tâche chacun. Les principaux outils que nous proposons d'utiliser pour résoudre ces problèmes sont le rééchantillonnage, la sélection de modèles et les méthodes à noyaux. Afin de renforcer les liens entre les quatre tâches, nous allons mettre en place un groupe de travail mensuel consacré à l'interaction interdisciplinaire; de plus, nous profiterons de la proximité géographique des différents membres du projet pour organiser de fréquentes réunions de travail entre deux ou trois d'entre eux. Retombées: Le projet DETECT vise à obtenir des résultats dans les domaines de la statistique mathématique, la vision artificielle et la bioinformatique qui seront diffusés: - en publiant dans des revues et actes de conférences internationaux de référence, - en participant à des conférences nationales et internationales, - en collaborant avec des biologistes (nous sommes déjà en contact avec des membres de l'INRA Jouy et de l'Institut Curie), - en rendant accessibles à un public aussi large que possible des packages R ou Matlab (par exemple) sous licence libre (GPL). A moyen terme, de nombreuses retombées sont à prévoir, parmi lesquelles: - Pouvoir annoter automatiquement des vidéos afin d'en extraire des séquences d'intérêt. - Découvrir les gènes prédisposant par exemple à une maladie cardiaque ou augmentant la productivité du blé. - Aider au diagnostic médical, notamment pour détecter un cancer grâce à un profil CGH.

Coordinateur du projet

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Aide de l'ANR 0 euros
Début et durée du projet scientifique : - 0 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter