Projets financés
AT2TA - Analogies: de la Theorie aux ouTils et Applications – AT2TA
Le raisonnement analogique est une capacité remarquable du raisonnement humain. Les proportions analogiques sont des déclarations de la forme "A est à B ce que C est à D". Elles sont la base de l'inférence analogique, utilisée dans des tâches d'apprentissage machine (ML) telles que la classification
Traduction automatique pour la science ouverte
Le projet MaTOS (Machine Translation for Open Science) vise à développer de nouvelles méthodes pour la traduction automatique (TA) intégrale de documents scientifiques, ainsi que des métriques automatiques pour évaluer la qualité des traductions produites. Notre principale cible applicative est la t
Apprentissage de mesure de similarité pour le transfert analogique
Le but du projet SMeLT est de fournir une méthodologie d'apprentissage d'une mesure de similarité qui soit optimisée pour une tâche particulière de transfert analogique. Parmi les différentes tâches qu'un système d'analogie computationnelle implémente, la tâche de transfert met en oeuvre une inf
Apprentissage par renforcement épistémique
Le projet EpiRL vise à étudier comment combiner la planification épistémique et l'apprentissage par renforcement (RL), en proposant de nouveaux algorithmes efficaces, adaptatifs et capables de calculer des décisions reposant sur la théorie de la connaissance et de la croyance. Nous attendons de cett
Co-construction adaptative et pérenne de l'éthique pour une IA de confiance
Comme les applications de l’IA peuvent avoir un impact bénéfique/néfaste sur les humains, un débat existe sur la manière d'y intégrer des capacités éthiques. Cela incite les chercheurs à développer des systèmes compatibles avec des valeurs éthiques, en passant de « l'éthique de conception » à « l'ét
Analyse de la Qualité Audio Pour Représenter, Indexer et Unifier les Signaux
La qualité audio est une caractéristique importante qui transporte une information intrinsèque sur le procédé de création d'une oeuvre musicale depuis son enregistrement jusqu'au mastering en studio. Récemment, nous avons proposé une méthode innovante permettant de détecter la liste d'effets appli
Bandits pour le suivi de patients
L'apprentissage artificiel est porteur de nombreux espoirs en médecine. Dans le projet BIP-UP, nous allons explorer la problématique du suivi individualisé de patient ayant subi une intervention en chirurgie baryatrique. Actuellement ce suivi est le même pour tous les patients alors que les praticie
TRAITEMENT DE L'INFORMATION DE NOUVELLE GÉNÉRATION DES IMAGES MICROSCOPIQUES À VALEUR VECTORIELLE : APPLICATION À L'IMAGERIE POLARISÉE DES CELLULES
Contrairement à la microscopie à fluorescence classique, la nouvelle génération d'instruments de microscopie à lumière polarisée permet de sonder l'orientation des biomolécules marquées par fluorescence dans les cellules. Comme les données générées correspondent à des signaux vectoriels 3D+temps pre
Une plate-forme argumentative pour la démocratie participative
La démocratie participative est une forme de gouvernement qui permet à chacun de participer à l'élaboration des lois. Elle présente de nombreux avantages puisqu'elle renforce l'intégration des citoyens dans le débat politique. Plusieurs plateformes en ligne existent; la plupart d'entre elles propose
Extraction de Connaissances LAtentes dans les Documents par une Analyse conjointe des Textes et des TAbles
Identifier, extraire, structurer et stocker des connaissances sont des tâches majeures. Elles constituent des défis importants pour les organisations, en partie à cause de la dispersion des connaissances au sein de différents types de sources (e.g. bases de données, feuilles de calcul, documents tex
Simplification Automatique de Textes Scientifiques
Les systèmes d'information donnent aux citoyens un accès à des informations provenant de sources fiables telles que la littérature scientifique. Cette dernière est difficilement accessible aux non-experts en raison de sa complexité langagière et du manque d’acculturation scientifique. Des décisions
Intelligence artificielle normative pour réguler la fabrication
La transformation numérique des industries manufacturières offre un environnement propice à l'adoption de technologies plus autonomes et (auto-)adaptatives, capables de répondre rapidement et avec souplesse aux changements endogènes et exogènes, tout en étant transparentes et en respectant des régle
AD-Lib : une bibliothèque d'agrégation/désagrégation pour des modèles de décisions séquentielles
L'omniprésence des solveurs SAT, de programmation par contraintes (CP) et de programmation linéaire en nombres entiers (MIP) dans la communauté optimisation a démontré l'importance des algorithmes génériques capables de résoudre tout problème qui peut s'exprimer dans un paradigme spécifique. Dan
l'IA au service du dépistage psychatrique
L'objectif du projet PORTRAIT est de développer une méthode de test adaptatif permettant d'adapter les questions d'un test en fonction des réponses précédentes du sujet. Pour cela, le projet ambitionne d'étendre les avancées récentes des systèmes de recommandation et des méthodes d'apprentissage par
Amélioration de la parole audiovisuelle basée sur l'apprentissage profond, robuste et efficace
L'amélioration de la parole est un problème fondamental dans le traitement du signal qui vise à améliorer la qualité et l'intelligibilité d'un signal de parole enregistré dans un environnement bruyant. Ceci est d'une importance pratique primordiale, par ex. pour les systèmes de reconnaissance automa
Apprentissage avec annotations limitées pour la classification des images médicales
Au cours des dernières années, les approches d’apprentissage profond ont connu un grand succès dans le domaine de la vision par ordinateur. Toutefois, cet apprentissage nécessite une quantité monstrueuse de données annotées pour atteindre les performances souhaitées. Dans le domaine de la santé, la
Faire progresser l'apprentissage fédéré tout en réduisant l'empreinte carbone
Les technologies de l’IA sont aujourd’hui trop gourmandes en énergie pour être compatibles avec nos objectifs de développement durable. Si des travaux récents ont permis d’évaluer l’empreinte carbone des méthodes d’apprentissage traditionnelles, celle d’une approche émergente comme l’apprentissage f
Interroger le Web avec des Concepts
Les moteurs de recherche du web traditionnels recherchent des chaînes de caractères sur le web. Cependant, la recherche par mots-clés renvoie souvent de nombreux documents non pertinents, ce qui pousse les utilisateurs à affiner leur liste de mots-clés en suivant un processus d'essais et d'erreurs.
Flots de Gradients de Wasserstein pour l'Optimisation et l'Echantillonnage: propriétés non asymptotiques dans le cas non log-concave – WOS
Un problème important en apprentissage et en statistique computationnelle est l'échantillonnage selon une distribution cible inconnue. En inférence bayésienne par exemple, cette dernière correspond à la distribution a posteriori des paramètres, qui n'est connue qu’à une constante de normalisation pr
Modèles de préférence explicables et parcimonieux pour tirer le meilleur parti des bases de données incohérentes
Le projet EXPIDA a pour but de fournir aux utilisateurs de bases de données une riche famille de méthodes explicables pour traiter des données imparfaites (c'est-à-dire incohérentes et/ou incertaines) dont le but est d'aider à l'analyse des données d'incidents aériens, et donc d'améliorer la sécurit
Tests Adaptatifs et Frugaux
Lors d'un processus de test, des observations sont rassemblées à propos d'un système inconnu (par exemple un nouveau médicament et un placebo) afin de répondre à une question (par exemple quel traitement est le plus efficace). Un protocole de test est bon s'il permet d'arrêter le test après un nombr
Graphes et algorithmes pour la classification des structures 3D et dynamiques des protéines – GRADIENT
La classification des formes est l'une des tâches les plus importantes de la vision par ordinateur, comme le démontre le grand nombre de travaux traitant de l'analyse des formes des objets 3D. Les formes des objets 3D peuvent être représentées par des graphes et, par conséquent, les techniques de gr
Optimisation décentralisée efficace en termes de communication, adaptative et fiable sur les graphes multi-tâches
CEDRO fait partie du vaste thème de l’inférence décentralisée (optimisation stochastique, estimation et apprentissage) sur graphes. Il reconnaît notamment la capacité croissante de nombreuses technologies émergentes à collecter des données de manière décentralisée et continue. Par conséquent, l’acce
Apprentissage auto-supervisé efficient pour des technologies de la parole inclusives et innovantes.
L’apprentissage auto-supervisé (Self-Supervised Learning ou SSL) a émergé récemment comme une méthode d’intelligence artificielle (IA) incroyablement prometteuse. Grâce à cette méthode, les colossales masses de données non annotées qui sont accessibles peuvent être utilisées par des systèmes d’IA p
Decouverte des interactions genotype-phenotype à l'aide de graphe de connaissance et d'IA
Les besoins en alimentation devraient croître considérablement dans les prochaines décennies. Pour relever ce défi dans un contexte de changement climatique, une meilleure compréhension des relations génotype-phénotype est cruciale pour améliorer les capacités de production des cultures. La recherch
Segmentation et regroupement de locuteurs via un modèle robuste unifié audio spatial et multimodal
La segmentation et regroupement en locuteurs (SRL) vise à répondre à la question : "qui parle et quand ?". Il s'agit d'un problème difficile à résoudre en raison de la complexité des scénarios (environnement de propagation, grand nombre de locuteurs et leurs mobilités...). En présence d'au moins deu
Cartographier la Terre via l'imagerie aérienne en apprenant sur des données de jeux
D'importants volumes de données d'Observation de la Terre (OT) sont disponibles grâce aux satellites européens Sentinel-2 et aux programmes français d'imagerie SPOT et BDORTHO. Néanmoins, cette masse de données est non-étiquetée et ne contient pas d'information sémantique utile pour l'apprentissage
Adapter et expliquer l'équité pour des affectations basées sur des préférences
De nombreuses applications concrètes traitent d’affectations basées sur des préférences : différents agents ont des préférences sur des éléments (activités, ressources ou encore d’autres agents) et celles-ci doivent être agrégées en une décision collective qui est une affectation des éléments aux ag
REPUBLIC: Vers l'IA responsable avec l'apprentissage par renforcement sous contraintes
Le développement d'une IA responsable requiert l'intégration de 3 éléments fondamentaux : la robustesse, le respect de la vie privée (privacy) et l'absence de biais (fairness). Dans le projet REPUBLIC, nous proposons d'étudier ces 3 aspects dans le cadre de l'apprentissage par renforcement (AR) sous
Le Pourquoi dans les films
Le projet WhyBehindScenes vise à développer de nouvelles méthodes pour comprendre automatiquement le scénario dans les vidéos, et en particulier le pourquoi dans les vidéos montées (dans les films et les émissions de télévision). L’exploration se fera dans deux directions : d’un côté en cherchant à
Espace d'échelles pour l'apprentissage machine sur des nuages de points 3d
Il y a plusieurs décennies, l'apparition de la photographie numérique a permis l'apparition et le développement de nouveaux champs de recherches (traitement d'image, reconnaissance de forme, vision par ordinateur), qui ont révolutionné notre vie quotidienne. Nous pensons que dans un futur proche, l'
Raisonnement axé sur les événements pour l'interprétation des récits du quotidien
Donner un sens aux récits du quotidien est une tâche difficile, qui nécessite une compréhension approfondie de la langue et des connaissances de bon sens. Alors que les humains peuvent s'appuyer sur un raisonnement de haut niveau pour tirer des conclusions, les modèles actuels manquent largement de
Multimodales Gestion des Données Frugales
Le besoin d'adresser la variété des données a ouvert la voie à la conception des bases de données multiples. Les multi-bases de données incluent les multistores, qui exposent une interface de requête déclarative unifiées sur des données hétérogènes, ainsi que les polystores qui combinent les avantag