Projets financés
Images aériennes historiques pour la caractérisation des transformations des territoires – HIATUS
Les images aériennes argentiques d'archives apportent un point de vue unique sur la dynamique des territoires. En effet, elles permettent de produire des séries temporelles longues, denses, à très hautes résolutions spatiales et munies d’une information d'altitude. Cependant l'hétérogénéité des imag
Les processus de textualisation : modélisations linguistiques, psycholinguistiques et d'apprentissage automatique – Pro-TEXT
Le projet de recherche Pro-TEXT analyse la textualisation, c'est-à-dire le processus de construction progressive d'un texte. Une meilleure connaissance de la textualisation permet de saisir les mécanismes qui relient la structure, les contraintes de genre textuel et les objectifs pragmatiques, d'aid
QualiHealth: Amélioration de la Qualité des Données de Soins – QualiHealth
Ce projet adresse les enjeux scientifiques liés à la qualité de données dans le domaine de la santé. Il vise les objectifs de recherche suivants (numérotés de 1 à 4). (O1) Analyse exploratoire et collection de jeux de données anonymisés. (O2) Spécification déclarative des indicateurs de qualité
Systèmes conversationnels de recherche d'information – SESAMS
Les systèmes conversationnels axés sur la recherche sont caractérisés par un contexte hétérogène impliquant : 1) un retour d'information implicite par rapport au moteur de recherche et/ou 2) des besoins d'information en langage naturel exprimés par le système conversationnel. Ce cadre complexe don
Analyse d'image et apprentissage pour des données de télédétection multi-variées, -temporelles, -résolution et -source – MULTISCALE
MULTISCALE est un projet de recherche dont l’objectif est de produire un cadre méthodologique complet et intégré pour l’analyse et l’apprentissage multi-échelles d’images satellites complexes. Bien que les représentations hiérarchiques d’images de télédétection aient donné lieu à des approches effic
Outils Neuronaux « End-to-End » pour la TRAduction des Communications – ON-TRAC
Le projet ON-TRAC vise à explorer les technologies émergentes issues du domaine du deep learn- ing (apprentissage automatique profond) afin de concevoir, implémenter, expérimenter et disséminer une approche nouvelle de traduction automatique de la parole qui s’affranchit de la contrainte ex- posée p
Inférence efficace des programmes de nettoyage à partir des annotations de données – InfClean
L'objectif d'InfClean est de repenser le domaine du nettoyage des données avec un cadre formel inclusif qui réduit radicalement l'effort humain de nettoyage des données. Comme décrit dans la proposition originale, le projet est exécuté selon trois directions de recherche: 1. Poser les bases théori
Apprentissage distribué, personnalisé, préservant la privacité pour le traitement de la parole – DEEP-PRIVACY
La reconnaissance vocale est maintenant utilisée dans de nombreuses applications, dont les assistants virtuels qui collectent, traitent et stockent des données vocales personnelles sur des serveurs centralisés, ce qui soulève de sérieuses préoccupations concernant la privacité. L’utilisation d’une r
Des Données aux Connaissances en Agronomie et Biodiversité – D2KAB
L'agronomie et la biodiversité doivent répondre à plusieurs grands défis sociétaux, économiques et environnementaux. Cependant, les données dans ces domaines sont produites en si grande quantité et si vite qu'elles remettent en question notre capacité à les transformer en connaissances exploitables
Une Perspective PAC-Bayésienne de l'Apprentissage de Représentations – APRIORI
L’objectif principal du projet APRIORI est de combler le fossé entre les pratiques en apprentissage de représentation et la théorie. Pour ce faire, nous adoptons le point de vue d’une théorie en apprentissage automatique appelée “théorie PAC-Bayésienne”. Cette théorie est connue pour apporter des ga
Accélérateurs Approximatifs pour Apprentissage Profond – AdequateDL
La charge de calcul requise pour l'exécution de réseaux de neurones convolutionnels (CNNs) les rend souvent hors de portée des systèmes embarqués avec des contraintes énergétiques, et les rendent coûteux même dans les centres de calculs. En relâchant le besoin de résultat exact, le calcul approximat
réSEaux Numériques de Données sémantiques: Utilité et vie Privée – SENDUP
De nos jours, les données sont souvent représentées sous forme de graphes avec une sémantique sous-jacente pour faciliter leur indexation et l'utilisation de moteurs d'inférence. C'est le cas, par exemple, dans les domaines des données liées et du web sémantique reposant typiquement sur la représent
Choix Social et Réseaux Sociaux – SCONE
Le projet SCONE étudie le choix social en présence d'un réseau social qui relie les décideurs. Il est construit autour de trois objectifs de recherche : • OBJ1 - L'étude de la diffusion d'opinions sous contraintes, notamment l'exploration des liens entre fonctions de mise à jour calculables en te
Analyse sans paramètre des surfaces discrètes – PARADIS
Le projet porte sur l'estimation de quantités géométriques locales et du premier ordre, telle que la direction du vecteur normal. Plus précisément, l'objectif principal est de trouver un estimateur de vecteurs normaux qui soit (i) efficace à calculer, (ii) sans paramètre et (iii) précis, c'est-à-dir
Apprentissage Statistique pour les Séries Temporelles Environnementales – MATS
Le projet MATS propose des approches novatrices dans le domaine de l'apprentissage dans les ensembles de séries temporelles, avec un intérêt tout particulier pour les méthodes permettant un passage à large échelle et qui peuvent opérer même lorsque la quantité d'annotations disponibles est relativem
Analyse et fouille du réseau d'utilisateurs de bitcoin – BITUNAM
Analyser les données de Bitcoin est complexe, d'une part en raison de la taille des données (centaines de Millions de transactions), mais aussi de la pseudonymité de ses acteurs, ainsi que simplement du manque de connaissance que nous avons de l'activité des acteurs et de leurs rôles. Le but de ce p
Un langage d'enchères pour des joueurs génériques d'enchères – AGAPE
L'objectif de ce projet est de concevoir et implanter un agent générique pour les enchères (GAP). Cet agent pourra comprendre et raisonner à propos des règles governant une enchère. Les agents automatiques sont aujourd'hui largement utilisés dans les enchères ; toutefois, ces agents sont le plu
Modélisation de tâches complexes en recherche d'information – CoST
Alors que la recherche d'information est considérée aujourd'hui comme une pratique 'naturelle' et 'facile', force est de constater que les systèmes de RI ne permettent pas d'assister les utilisateurs dans l'accomplissement d'un large éventail de tâches de RI effectuées au quotidien. Dans le cadre du
Analysis d’images multi-modales d’observation de la Terre – MAESTRIA
Le projet MAESTRIA (Multi-modAl Earth obServaTion Image Analysis) vise à résoudre les verrous méthodologiques relatifs à l'analyse automatique des gros volumes d'images acquises par les satellites d'Observation de la Terre (OT). MAESTRIA a pour finalité la production de cartes d'occupation et d'usag
Apprentissage statistique pour la compréhension de scènes audio – LEAUDS
Une machine peut interpréter et comprendre des images, reconnaître de la parole et de la musique. Cependant, elle est difficilement capable de comprendre des scènes audio ambiantes, par exemple les sons qui se produisent dans une cuisine au matin ou les sons se produisant dans une rue à proximité
Apprivoiser la Pré-image – APi
L'essor des méthodes d'apprentissage est certainement dû aux méthodes à noyaux et à la résurgence des réseaux de neurones dits profonds. Leur clé de voûte est le pré-traitement des données avec une transformation non linéaire qui les plonge dans un espace de redescription où les techniques de traite
Réseau de mémoire visuelle pour l'interprétation de scènes – AVENUE
Les humains interprètent visuellement de nouveaux environnements, interagissent avec et se déplacent dedans avec peu d'effort. Malgré des progrès significatifs, ce niveau d'intelligence visuelle n'est pas atteint par des systèmes artificiels. Le projet AVENUE cherche à corriger ceci via un réseau de
Apprentissage de préférences en environnement fortement incertain – PreServe
L'apprentissage de préférences d'un utilisateur joue un rôle central dans de nombreux problèmes, allant d'aider un décideur à choisir parmi quelques alternatives très complexes, jusqu'à aider un utilisateur à choisir la meilleure options parmi des milliers, voir des millions d'entre-elles. Un problè
Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond – LUDAU
LUDAU est un projet qui relève du domaine de l’apprentissage automatique appliqué, visant à explorer des situations d’apprentissage peu supervisé sur de grands corpus de parole et de bruits environnementaux, en s’appuyant entre autres sur le paradigme du deep learning et les réseaux de neurones prof
Requêtes Ontologiques Complexes sur des Fédérations de Données Hétérogènese – CQFD
L’accès aux données médiatisé par une ontologie (OMQA) est un paradigme récent pour l’accès et l’intégration de base de données pré-existantes permettant d’exploiter métadonnées et connaissances disponibles sur le domaine d’application. Pendant la dernière dizaine, les efforts de recherche sur l’OMQ