ChairesIA_2019_2 - Chaires de recherche et d'enseignement en Intelligence Artificielle - vague 2 de l'édition 2019 2020

Dynamique des croyances pour une meilleure analyse des informations provenant de sources multiples – BE4musSIA

Dynamique des croyances pour l'analyse d'informations multi-sources

Considérons un cadre où l'on reçoit un flot continu d'informations potentiellement contradictoires à partir d'un ensemble de sources de fiabilité initialement inconnue. A partir de ces informations, il est nécessaire à tout moment de i) se former une opinion ii) d'évaluer la fiabilité des différentes sources. Le but de ce projet est d'étudier ces deux tâches, et de les réaliser conjointement, afin d'obtenir la meilleure évaluation possible.

changement de croyances pour l'analyse d'information

* Améliorer les opérateurs de révision de croyances<br />* Améliorer les opérateurs de fusion de croyances<br />* Développer les mesures d'incohérences et les mesures de conflits<br />* Appliquer l'ensemble de ces outils à l'analyse d'information multi-source<br />* Illustrer les outils développés dans ce projet dans le cadre du web sémantique, afin d'améliorer l'interrogation d'ontologies multiples

Utilisation de méthodes venant de la représentation de connaissance et modélisation du raisonnement, et de la théorie du choix social

fin de réaliser cette analyse d'informations multi-sources, nous utiliserons et développerons des outils de représentation des connaissances et de modélisation du raisonnement (KR), ainsi que des outils provenants de la théorie des jeux et de la théorie du choix social pour les aspects stratégiques et de décision (de groupe). Nous utiliserons en particulier des méthodes venant des théories de la révision et de la fusion de croyances, qui formalisent l'évolution rationnelle des croyances, ainsi que des mesures d'incohérence, qui permettent de mesurer à quel point plusieurs informations sont en conflits.

Résultats

WP1: Révision de croyances

Nous avons proposé plusieurs généralisation de ces opérateurs de révision de croyances, ce qui permet d’élargir le spectre d’opérateurs à la disposition de la communauté, et de définir et de comprendre les opérateurs dont nous avons besoin pour la réalisation de ce projet.

Une première piste a été d’explorer le lien entre opérateurs de changement itéré et opérateurs de fusion, ce qui nous a permis de définir les premiers opérateurs de changements commutatifs, ainsi que mettre l’accent sur le fait que les états épistémiques utilisés habituellement en révision itérée doivent avoir une structure plus complexe qu’un simple pré-ordre.

Une seconde piste a été d’étudier comment définir des opérateur de révision sur des logiques paraconsistantes. C’est un travail important à plusieurs titres. D’abord cela fournit une généralisation des opérateurs classiques. Mais cela permet également une reflexion générale sur ce que sont la révision et l’expansion lorsque certains modèles des connaissances de l’agents sont plus importants que d’autres.

WP2: Fusion de croyances

Pour la fusion de croyances nous nous sommes intéressés à la capacité des opérateurs de fusion de croyances à identifier la vérité à partir des opinions recueillies. Plus exactement nous avons montré quels étaient les opérateurs qui étaient les meilleurs estimateurs de plausibilité (maximum likelihood estimators) pour certaines fonctions de bruits standards.

Nous avons également étudié les liens entre opérateurs de fusion de croyances et méthodes de vote, en particulier la méthode de vote de Borda. Nous avons proposés plusieurs opérateurs de fusion inspirés par cette méthode de vote.

WP5: Application aux réponses aux requêtes sur des ontologies multiples

Nous avons proposés des opérateurs de fusion pour les ontologies.
Nous avons également plusieurs publications sur l’utilisation des embeddings pour permettre de fournir un contexte, permettant une meilleure compréhension, et un meilleur apprentissage pour plusieurs applications.

Perspectives

WP1: Révision de croyances

Nous travaillons actuellement sur la preuve que la représentation canonique des états épistémiques utilisés pour le changement itéré est les fonctions ordinales conditionnelles.

Nous travaillons également à une généralisation des opérateurs d'expansion, dans tous les cas où une partie des modèles des croyances de l'agent sont plus importants que d'autres.

WP2: Fusion de croyances

Cette thématique est celle de la thèse de Chouaib Fellah, recruté dans le cadre de cette chaire sur ce sujet.
Nous travaillons actuellement sur la problématique de la fusion lorsque les sources ont des fiabilités différentes.

WP3: Mesures d’incohérences et mesures de conflit

Nous travaillons actuellement sur la classification d’un certain nombre de mesures d’incohérences sémantiques, grâce à un cadre général permettant de retrouver les principales mesures d’incohérences sémantiques comme cas particuliers.

WP4: Analyse d’information multi-sources

Cette thématique est celle de la thèse de Quentin Elsaesser, recruté dans le cadre de cette chaire sur ce sujet. Les premiers résultats sont prometteurs, et il semble que la méthode sur laquelle nous travaillons soit plus efficace que les méthodes existants pour l'évaluation de sources d’information sur le web.

Productions scientifiques et brevets

Nicolas Schwind, Sébastien Konieczny: Non-Prioritized Iterated Revision: Improvement via Incremental Belief Merging. KR 2020: 738-747
I. Bloch, S. Blusseau, R. Pino Pérez, E. Puybareau and G. Tochon. On Some Associations Between Mathematical Morphology and Artificial Intelligence. Discrete Geometry and Mathematical Morphology (LNCS 12708). pp. 457-469, 2021.
Kun Yan, Chenbin Zhang, Jun Hou, Ping Wang, Zied Bouraoui, Shoaib Jameel, Steven Schockaert: Inferring Prototypes for Multi-Label Few-Shot Image Classification with Word Vector Guided Attention, AAAI 2022
Rana Alshaikh, Zied Bouraoui, Steven Schockaert: Hierarchical Linear Disentanglement of Data-Driven Conceptual Spaces. IJCAI 2020: 3573-3579
Na Li, Zied Bouraoui, José Camacho-Collados, Luis Espinosa Anke, Qing Gu, Steven Schockaert: Modelling General Properties of Nouns by Selectively Averaging Contextualised Embeddings. IJCAI 2021: 3850-3856
Kun Yan, Zied Bouraoui, Ping Wang, Shoaib Jameel, Steven Schockaert: Aligning Visual Prototypes with BERT Embeddings for Few-Shot Learning. ICMR 2021: 367-375
Nicolas Schwind, Sébastien Konieczny; Ramón Pino Pérez: On paraconsistent belief revision in LP. AAAI 2022.
Zied Bouraoui, Sébastien Konieczny, Truong-Thanh Ma, Ivan Varzinczak: Model-based Merging of Open-Domain Ontologies. ICTAI 2020: 29-34
Patricia Everaere, Sébastien Konieczny, Pierre Marquis: Belief Merging Operators as Maximum Likelihood Estimators. IJCAI 2020: 1763-1769
Patricia Everaere, Chouaib Fellah, Sébastien Konieczny, Ramón Pino Pérez: Borda, Cancellation and Belief Merging. KR 2021: 291-300
A. Mata Diaz, Ramón Pino Pérez. Merging Epistemic States and Manipulation. ECSQARU 2021: 457-470

Résumé de soumission

Considérons un cadre où l'on recoit un flot continu d'informations potentiellement contradictoires à partir d'un ensemble de sources de fiabilité initialement inconnue. A partir de ces informations, il est nécessaire à tout moment de i) se former une opinion ii) d'évaluer la fiabilité des différentes sources.

Ce problème se présente:
- si on utilise plusieurs média pour se forger sa propre opinion sur un sujet
- si plusieurs capteurs (de fiabilité inconnue ou variable) fournissent des informations à un robot
- si plusieurs personnes fournissent des informations sensibles à des journalistes ou à une agence de renseignements
- si l'on veut répondre à une requête en interrogeant plusieurs sources de données sur internet.

Le but de ce projet est d'étudier ces deux tâches, et de les réaliser conjointement, afin d'obtenir la meilleure évaluation possible, ce qui est crucial pour les scénarios mentionnés ci-dessus.

Afin de réaliser cette analyse d'informations multi-sources, nous utiliserons et développerons des outils de représentation des connaissances et de modélisation du raisonnement (KR), ainsi que des outils provenants de la théorie des jeux et de la théorie du choix social pour les aspects stratégiques et de décision (de groupe).

Nous utiliserons en particulier des méthodes venant des théories de la révision et de la fusion de croyances, qui formalisent l'évolution rationelle des croyances, ainsi que des mesures d'incohérence, qui permettent de mesurer à quel point plusieurs informations sont en conflits.

Ce problème d'évaluer la fiabilité de différentes sources d'informations à partir d'une confrontation des différentes informations fournies ne semble pas avoir été largement étudié pour le moment. Mais, intutivement, on peut par exemple suspecter une source qui fournit régulièrement des informations qui contredisent la plupart des autres sources de se tromper (en se basant sur des arguments de type théorème du jury de Condorcet). Notre but est de définir différentes classes de mesures de fiabilité basées sur cette analyse des conflits.

Mais nous ne souhaitons pas isoler cette tâche (estimation de la fiabilité) de celle consistant à se forger sa propre opinion à partir des informations conflictuelles recues (la tâche de fusion). Donc, une des originalités de ce projet est de s'intéresser à ces deux tâches simultanément. En fait nous pensons que ces deux tâches doivent être réalisées conjointement afin d'obtenir des résultats optimaux. En particulier, nous souhaitons étudier des processus de convergence conjoints, où l'on utilise par exemple le résultat de la tâche de fusion pour estimer la fiabilité des sources. Cette fiabilité estimée peut alors être utilisée pour améliorer le résultat de la fusion, qui peut alors être utilisé pour améliorer l'estimation de la fiabilité, etc.

Cette analyse dépendra également de la quantité d'information que notre agent est capable de stocker. On étudiera les cadres où il ne peut stocker aucune information sur les sources, ceux où il peut stocker une unique formule représentant un résumé des informations fournies par chaque source jusque là, et ceux où il peut stocker l'ensemble de l'historique des messages recus.

En ce qui concerne les résultats que l'on peut attendre de ce projet, au niveau académique, cela permettra des avancées sur les théories de la dynamique des croyances, de la fusion de croyances, des mesures d'incohérences, ainsi que la définition et le développement d'outils pour l'analyse de l'information multi-sources.

Et, en ce qui concerne la valorisation, nous appliquerons ces résultas aux cadres d'applications listés initialement. Nous nous concentrerons particulièrement sur l'application au web, que ce soit sur le raisonnement à partir d'ontologies multiples, ou pour répondre à des requêtes utilisateurs en utilisant plusieurs ressources internet.

Sébastien Konieczny (Centre de Recherche en Informatique de Lens)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

CRIL Centre de Recherche en Informatique de Lens

Aide de l'ANR 557 280 euros
Début et durée du projet scientifique : août 2020 - 48 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.