Blanc SIMI 2 - Blanc - SIMI 2 - Science informatique et applications

Techniques ASP pour l'interrogation d'informations web hétérogènes multisources à grande échelle – ASPIQ

ASPIQ

Le projet ASPIQ (ANR-12-BS02-0003) est un projet de recherche fondamentale labellisé par l'ANR dont l'objectif est de proposer des solutions originales pour l'interrogation d'informations hétérogènes multi-sources à grande échelle.

Objectifs du projet ASPIQ

L'objectif de ce project est de proposer :<br />1. Des extensions de l'ASP standard pour la représentation de sous-langages traitables de OWL2 afin de fournir une représentation commune des connaissances fournies par de multiples sources, permettant de traiter l'incohérence, les exceptions, l'incertain tout en restant compatible avec l'interrogation efficace de bases de connaissances comportant un grand nombre de données.<br />2. De nouvelles opérations de fusion d'informations représentées en ASP étendu, de diverses fiabilités et qualités, avec ou sans incertain, selon l'hypothèse ou pas de commensurabilité. Par ailleurs, des algorithmes efficaces seront proposés pour la gestion de conflits entre programmes ASP étendus.<br />3. L'identification de sous-classes de l'ASP étendu permettant une implantation efficace de mécanismes d'interrogation capable de calculer et d'ordonner les réponses les plus pertinentes.<br />4. Une implantation efficace de la gestion de l'incohérence, des opérations de fusion, du raisonnement révisable comme la gestion des exceptions, l'incertain possibiliste et l'interrogation de multiples bases de connaissances à grande échelle. La mise au point d'un prototype d'un système de raisonnement capable de d'éffectuer des opérations de fusion, de résoudre des conflits et d'interroger de multiples bases de connaissances.

La méthodologie utilisée repose sur le choix de trois langages de représentation des informations :

La logique de description pour ontologies légères DL-Lite, qui est langage de haut niveau, utilisé pour représenter les ontologies dans un dialecte de OWL2. Ce langage n’est pas très expressif mais il est adapté aux bases de connaissances comportant de grandes masses de données et de plus les problèmes de satisfaisabilité et d’interrogation par requêtes conjonctives dans ce langage sont polynomiaux.

Answer Set Programming (ASP) qui est un formalisme unifié qui permet à la fois la représentation des connaissances et le raisonnement en intelligence artificielle. C’est un langage très expressif qui est adapté à la représentation d’exceptions et d’information incomplètes, de plus il existe de nombreux solveurs efficaces pour le raisonnement non-monotone.

Les règles existentielles sont un formalisme qui peut être vu commune extension du langage Datalog ou comme une traduction logique des règles de graphes conceptuels, adapté à l’interrogation dans le cadre de l’accès aux données basé sur des ontologies (OBDA). C’est un langage intermédiaire entre DL-Lite et ASP offrant un compromis entre expressivité et complexité algorithmique.

Les résultats majeurs du projet se déclinent en termes de représentation des connaissances :

• ?ASP : langage qui généralise à la fois ASP par l’ajout et le traitement de variables existentielles, et les règles existentielles par l’ajout et le traitement de règles non-monotones ;

• ?-DL-Lite : l’extension possibiliste de la logique de description légère DL-Lite qui permet la représentation de l’incertain dans la logique DL-Lite ;

Ils se déclinent aussi en termes de tâches de raisonnement :

• Révision et fusion de programmes logiques ASP
• Révision et fusion de bases de connaissances exprimées en DL-Lite et en ?-DL-Lite
• Interrogation tolérante aux incohérences dans les bases de connaissances exprimées en règles existentielles, avec la définition d’un cadre unifié pour les relations d’inférences
• Interrogation de programmes logiques ASP

Un prototype a été implanté qui, à partir d’une base de connaissances exprimée dans un fragment d’OWL2 produit un programme logique ASP. Le prototype a été expérimenté sur l’application portant sur l’interrogation d’informations à partir de relevés 3D de sites archéologiques sous-marins et fournit un outil d’aide utile aux archéologues sous-marins pour l’étude des épaves.

Trois workshops internationaux ont été organisés dans le cadre du projet « ONTOlogies and Logic programming » (http://ontolp.lsis.org) ONTOLP 2015 (conjointement à IJCAI 2015), ONTOLP 2016 (conjointement à IJCAI 2016) et « ASP technologIes for Querying large scale multisource heterogeneous web information » (http://waspiq2017.lsis.org) WASPIQ 2017 (conjointement à (IEA/AIE 2017).
Le projet fait l’objet de deux thèses. Il a donné lieu à de nombreuses publications dans des revues internationales (TPLP 2017, JLC 2017, AMAI 2017, …) et dans des conférences internationales (ECAI 2014, JELIA 2014, IJCAI 2015, IJCAI 2016, KR 2016, ECAI 2016, IJCAI 2017, …)
(Voir Site : aspiq.lsis.org)

Le projet offre de nombreuses perspectives.

L’extension d’ASP avec variables existentielles en tête de règles (?ASP) a été réalisée d’un point de vue théorique et d’un point de vue pratique, une nouvelle version du solveur ASPeRiX est désormais disponible, des optimisations sont à étudier afin de d’améliorer l’efficacité de l’interrogation, en particulier la minimisation de l’instanciation de règles nécessaires pour répondre aux requêtes.
?ASP généralise à la fois ASP et les règles existentielles et l’identification de classes décidables de ce langage est une problématique importante. Des conditions d’arrêt du mécanisme de saturation ont été données pour la classe FES, cependant, la redéfinition d’un mécanisme de réécriture en ?ASP est un problème ouvert et difficile.

Un cadre unifié a été proposé pour les relations d’inférences tolérant l’incohérence pour des bases de connaissances représentées dans le formalisme des règles existentielles, qui capture les relations d’inférence connues et de propose de nouvelles relations d’inférence, c’est une feuille de route qui donne des pistes pour la définition de nouvelles relations d’inférence de complexité polynomiale.

L’extension possibiliste qualitative de DL-Lite a été réalisée avec une sémantique basée sur le min, une extension possibiliste quantitative avec une sémantique basée sur le produit est une suite naturelle.

La révision et la fusion de programmes ASP proposées pourraient être étendues aux programmes ASP possibilistes, et afin d’introduire l’incertain dans ?ASP, une étude pourrait porter sur l’extension possibiliste de ?ASP.

L’application à l’interrogation à partir de relevés 3D de sites archéologiques sous-marins fournit un outil pour les archéologues, en particulier la possibilité de visualiser les cartes de densité de sites. D’autres applications utilisant des règles par défaut sont envisageables pour l’interrogation à partir de relevés 3D dans le cadre de l’archéologie du bâti.

Publications

Edition d’ouvrage (2): CEUR-WS proc 205, No special AMAI S83 2018
Chapitre de livre (1) : BRA 2013
Revues Internationales (5) : ACM-CL 2016, AMAI 2017, TPLP 2017, JLC 2017, AMAI 2018
Conférences internationales (28) : SUM 2013 (2), IAT 2013, ISAIM 2014, ECAI 2014 (3), JELIA 2014, ICTAI 2014, SUM 2014 (3), FLAIRS 2015, BRA 2015, ECSQARU 2015, IJCAI 2015, SUM 2016 (2), KR 2016, ECAI 2016, JELIA 2016, IJCAI 2016, AAMAS 2017 (2), RuleML+RR 2017, ECSQARU 2017, SUM 2017, IJCAI 2017
Conférences nationales (7) : MFI 2013, JIAF 2013, RFIA 2014(2), JIAF 2014, LFA 2014, JIAF 2015
Workshops internationaux (11) : NMR 2014, ONTOLP 2015 (2), ONTOLP 2016 (2), ESWC 2017, WASPIQ 2017 (5)

Thèses

Z. Bouraoui. Inconsistency and uncertainty handling in lightweight description logics. Université d’Artois. Juin 2015.

F. Garreau. Extension d’ASP pour couvrir des fragments DL traitables : étude théorique et implémentation. Université d’Angers et Université Montpellier 2. Novembre 2016.

Logiciels

plrsf : logiciel mettant en œuvre la fusion de programmes ASP.
dlgp2easp : traducteur d’un fichier .dlgp en un fichier .easp.
eASPeRiX : extension du solveur ASPeRiX avec règles existentielles en tête de règles.
easp2asp : traducteur d’un fichier .easp en un fichier .asp.
module d’interrogation intégré dans eASPeRiX (LERIA) : interrogation de programmes ASP.
module de visualisation des résultats des requêtes intégré dans l’outil Arpenteur (LSIS)
Prototype : intégration des outils précédents afin de mettre en œuvre l’interrogation de bases de connaissances.
?-DL-Lite : un outil pour représenter et raisonner avec des ontologies DL-Lite possibiliste. Il implémente, en particulier, un nouvel algorithme de calcul de degré d’incohérence.
no-inference : outil développé en Java pour l’inférence tolérant l’incohérence par non-objection dans le cadre d’OBDA.
GoDL : outil de gestion de bases de connaissances DL-Lite possibilistes ordonnées potentiellement incohérentes.

L'objectif du projet est de proposer des solutions originales pour l'interrogation d'informations hétérogènes multi-sources à grande échelle. Il s'articule autour de trois axes :
Traiter des informations multi-sources : La fusion de systèmes d'informations issues de plusieurs sources est une tâche importante pour les applications du Web, où les informations sont souvent redondantes, hétérogènes, imprécises, incertaines. Par ailleurs, les informations fournies par chacune des sources sont cohérentes, cependant leur union peut ne pas l'être. Ce projet propose des solutions adéquates à ce problème d'incohérence.
Traiter des informations hétérogènes : Les informations fournies par les sources sont souvent hétérogènes. Ce projet se concentre sur les langages du web tels que la famille des langages OWL2 , en particulier, les sous-langages dédiés à l'interrogation OWL2EL, OWL2QL, OWL2RL. Néanmoins, les langages disponibles actuellement ne permettent pas le traitement, de façon satisfaisante, de l'incertain et de la gestion de l'incohérence..
Raisonner à grande echelle: La mise en oeuvre effective du traitement d'un grand volume d'informations multi-sources hétérogènes nécessite des outils adaptés. Le paradigme ASP, avec la mise au point de solveurs de plus en plus performants, s'est imposé ces dernières années comme outil efficace d'implantation mais aussi comme formalisme de représentation expressif. Cependant, la plupart des solveurs sont dédiés à la logique propositionnelle, aussi une extension d'ASP est nécessaire pour traiter des connaissances ontologiques représentées dans des sous-langages d'OWL2.
Ce projet a pour principale ambition de proposer :
1.des extensions de l'ASP standard pour représenter des sous-langages traitables d'OWL2 afin de fournir une représentation commune de la connaissance fournie par les differentes sources, permettant le traitement des incohérences, des exceptions et de l'incertitude afin d'interroger efficacement des bases de connaissances comportant de grandes masses de données.
2.de nouvelles opérations de fusion d'informations représentées par des programmes logiques en ASP étendu de fiabilité et de qualité diverses avec ou sans incertitude, sous l'hypothèse de commensurabilité ou non. Par ailleurs, des algorithmes efficaces seront proposés pour la gestion des conflits entre programmes logiques en ASP étendu.
3.L'identification de sous-classes de l' ASP étendu permettant une implantation de mécanismes effecaces d'interrogation , capable en plus, d'ordonner et de calculer les réponses les plus pertinentes.
4.Une mise en oeuvre efficace de la gestion de l'incohérence, d'opérations de fusion, du traitement des exceptions et de l'incertain, de l'interrogation de bases de connaissances. La mise au point d'un prototype capable d'effectuer la fusion, de résoudre les conflits et d'interroger plusieurs bases de connaissances. Ce prototype sera expérimenté sur 2 applications :
l'intégration de données Web, qui consiste à l'interconnection de sources de données web (catalogues bibliographiques) en collaboration avec ABES (http://www.abes.fr).
L'interrogation d'informations à partir de relevés 3D pour aider les archéologues à étudier les sites sous-marins, à la suite du projet européen VENUS (http://sudek.esil.univmed.fr/venus/).

Ce projet prend toute sa place dans les différentes directions de recherche qui sont tout à fait d'actualité au niveau international.
Ce projet réunit 4 partenaires CRIL, LERIA, LIRMM, LSIS et combine des compétences complémentaires dans différents domaines de l'intelligence artificielle. Il est à noter que les participants au projet sont particulièrement bien placés dans la communauté internationale comme en témoignent leurs excellents résultats récents en termes de publications dans des revues prestigieuses internationales et dans des conférences prestigieuses comme ECAI, IJCAI, KR, AAAI.

Coordination du projet

Odile PAPINI (Organisme de recherche)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

CRIL Centre de Recherche en Informatique de lens
Inria / LIRMM Inria Sophia Antipolis / LIRMM
LERIA Laboratoire d'Etude et de Recherche en Informatique d'Angers

Aide de l'ANR 371 946 euros
Début et durée du projet scientifique : septembre 2012 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter