CONTINT - Contenus et Interactions

Analyse Contextuelle et Recherche d’information Adaptative – CAAS

Résumé de soumission

Les systèmes de recherche d’information (SRI) ont pour objet de retrouver l’information qui répond au besoin d’information exprimé par l’utilisateur via une requête. Le principe de recherche se base d’une part sur un processus en amont qui vise à indexer les documents via des termes représentatifs, d’autre part sur la mise en correspondance des représentations des documents ainsi créés et de la requête en cours de traitement afin de restituer les documents les plus susceptibles de répondre au besoin de l’utilisateur. Les SRI actuels comme les moteurs du web se comportent de la même façon quelque soit le contexte de recherche, l’utilisateur, le type du besoin d’information et d’usage de l’information.
L’hypothèse du projet CAAS est que la prise en compte du contexte pourrait améliorer les performances du système. Le contexte fait référence ici à des connaissances implicites ou explicites concernant les intentions de l’utilisateur, son environnement et le système lui-même.
Les principaux verrous scientifiques du projet sont:
. Le contrôle de la variété des contextes: pour lever ce verrou, nous devrons définir des modèles pour représenter les différents aspects du contexte en RI, la variété des traitements et leur adéquation avec la variété des contextes.
. Apprendre les contextes: Le système doit être capable d’avoir une intelligence pour décider la meilleure technologie ou la meilleure méthode pour un contexte donné, par exemple adapter la méthode de recherche au contexte.
. Reconnaitre un contexte: lorsqu’un contexte apparaît, il faut que le système soit capable de le reconnaitre parmi tous les contextes appris pour y réagir.
CAAS considèrera les divers aspects qui peuvent influencer les résultats d’une recherche d’information, d’abord de façon la plus indépendante possible, puis en considérant les effets croisés. Nous étudierons ainsi les éléments contextuels suivants: les attentes des utilisateurs et les requêtes, les documents et les composants des SRI.
Pour chacun d’eux, nous considèrerons diverses collections que nous caractériserons, puis nous analyserons ces éléments en détail afin d’extraire des modèles. Un des résultats pourrait être que la reformulation de requêtes est utile lorsque la requête comporte au moins un nom propre.
Nous considèrerons à la fois des collections internationales largement utilisées par la communauté RI et des collections issues d’entreprises. Notre objectif est aussi de développer des modules à partir des résultats qui seront intégrés dans des plateformes de RI pour permettre leur ré-utilisation comme composants d’un système de RI.
Le cœur du projet étant l’analyse et la modélisation, les partenaires sont tous des laboratoires publics. Les entreprises sont toutefois largement impliquées. Nous avons le soutien d’un des moteurs majeurs du web et d’un moteur plus modeste qui nous fourniront des logs de connexion. Les entreprises seront également considérées lors de la phase de dissémination : les résultats seront présentés et une personnalisation des modules développés en fonction de leurs propres besoins sera étudiée. Par exemple, une application pourrait être de suggérer des publicités à associer à une requête d’un utilisateur sur un site.
Pour résoudre ces challenges, le partenariat du projet est composé de deux laboratoires de recherche en informatique, tous les deux spécialistes de RI, mais avec des expertises complémentaires. Le LIA-Laboratoire Informatique Avignon travaille principalement sur les problèmes de questions/réponses alors que l’IRIT -Institut de Recherche en Informatique de Toulouse est plutôt spécialiste de la recherche adhoc et la détection de la nouveauté. L’IRIT travaille en relation étroite avec l’IMT-Institut de Mathématique de Toulouse, équipe Statistique et Probabilité. L’IMT n’est pas un partenaire du projet mais travaillera en lien avec l’IRIT. CLLE-Cognition, Langues, Langage, Ergonomie est spécialiste en linguistique et traitement du langage naturel.

Coordination du projet

Josiane MOTHE (UNIVERSITE TOULOUSE III [PAUL SABATIER]) – mothe@irit.fr

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

CLLE CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE MIDI-PYRENEES
IRIT UNIVERSITE TOULOUSE III [PAUL SABATIER]
LIA UNIVERSITE D'AVIGNON ET DES PAYS DE VAUCLUSE

Aide de l'ANR 438 568 euros
Début et durée du projet scientifique : - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter