CE23 - Données, Connaissances, Big data, Contenus multimédias, Intelligence Artificielle

Modélisation de tâches complexes en recherche d'information – CoST

Résumé de soumission

Alors que la recherche d'information est considérée aujourd'hui comme une pratique 'naturelle' et 'facile', force est de constater que les systèmes de RI ne permettent pas d'assister les utilisateurs dans l'accomplissement d'un large éventail de tâches de RI effectuées au quotidien. Dans le cadre du projet CoST, nous nous intéressons particulièrement aux tâches dites complexes. Ces dernières sont caractérisées par les propriétés suivantes : (1) la recherche se déroule selon plusieurs sessions de recherche qui impliquent une complexité cognitive, une interaction intensive utilisateur-système et qui, de plus, exploite de nombreuses ressources ; (2) la tâche est généralement structurée en sous-tâches qui couvrent différents aspects thématiques ; (3) la tâche conduit à l'agrégation et la mise en relations d'informations issues à différents stades de l'historique de recherche ; (4) le résultat de la tâche se traduit par son accomplissement. Il est clair, que les utilisateurs effectuant ce type de tâches de RI ont des attentes qui dépassent la basique liste des 'ten blue links'. Cependant l'état de l'art révèle que de telles tâches sont loin d'être résolues par les systèmes de RI actuels. L'ambition du projet CoST est de définir le cadre théorique d'une nouvelle génération de systèmes de RI orientée tâche permettant d'assister l'utilisateur à prendre les décisions optimales leur permettant d'accomplir des tâches structurées ayant de surcroit un niveau élevé de complexité cognitive. Ceci fait émerger la nécessité : (1) d'identifier des classes de comportement utilisateurs caractéristiques de ces tâches. Notre objectif à ce niveau est de découvrir des régularités de comportement inter-utilisateurs en les reliant à la nature de la tâche ; (2) d'apprendre des structures explicites de tâches complexes sur la base de ces classes de comportements. Notre objectif à ce niveau est de capturer les relations de dépendance en étapes de recherche et les relier à des sous-tâches en mettant en avant la structure globale de la tâche associée ; (3) modéliser le paradigme de RI orientée tâche en reliant la pertinence de l'information à l'accomplissement de la tâche. L'idée de base est d'exploiter les motifs de comportements d'une part, et la structure de la tâche d'autre part, dans le but de prédire les actions adéquate à suggérer à l'utilisateur dans la direction de l'optimisation de la tâche. L'objectif principal du projet CoST est alors de définir le cadre théorique d'un nouveau paradigme de la RI, basé tâche qui passe par : (1) la définition d'un nouveau concept en l'occurrence 'la tâche', vue comme une variable cachée à inférer et introduire dans un modèle de RI selon une approche qui croise les points de vue de l'informatique et de la psychologie cognitive ; (2) la définition de nouveaux modèles de RI qui s'articulent sur une définition formelle et opérationnelle de la tâche complexe pour passer de l'estimation de la pertinence à l'accomplissement de la tâche. La méthodologie générale repose sur l'utilisation d'approches basées sur l'apprentissage profond pour la modélisation du comportement utilisateur et des tâches associées et des méthodes d'apprentissage par renforcement pour la définition des modèles de RI basés tâches. Plus spécifiquement, ce projet explore des méthodes d'identification des patrons de tâches (WP1) qui serviront d'entrée pour l'apprentissage des représentations des tâches complexes (WP2) avec l'objectif de formaliser des modèles qui optimisent le résultat de la tâche (WP3). Ces modèles seront validés et étendus en se basant sur le cas d'étude 'apprentissage humain' (WP4) qui fournit également des stratégies de recherche valides. Ce projet de recherche fondamentale est mené par 4 partenaires spécialistes en RI, apprentissage statistique et science cognitive.

Coordinateur du projet

Institut de Recherche en Informatique de Toulouse (Laboratoire public)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Institut de Recherche en Informatique de Toulouse
COGNITION, LANGUES, LANGAGE, ERGONOMIE
Patrick Levy
Laboratoire d'informatique de Paris 6

Aide de l'ANR 544 464 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles