Raisonnement axé sur les événements pour l'interprétation des récits du quotidien – ERIANA
ERIANA
ERIANA développe une IA capable de comprendre et raisonner sur des récits du quotidien, en combinant apprentissage profond et logique symbolique pour améliorer l’interprétation du langage naturel.
Vers une IA capable de comprendre et raisonner sur des conversations
L’essor de IA a permis des avancées majeures en traitement automatique du langage naturel. Cependant, les systèmes actuels peinent encore à comprendre les récits du quotidien, à interpréter les événements de manière cohérente et à raisonner au-delà des simples associations de mots. Le projet ERIANA vise à combler cette lacune en développant une IA capable de raisonner sur des narrations complexes en s’appuyant sur des modèles neuro-symboliques. Contexte et problématique Les récits jouent un rôle fondamental dans la communication humaine, que ce soit dans les médias, les échanges sociaux ou les avis en ligne. Pourtant, les modèles actuels de traitement du langage sont souvent limités à des analyses superficielles basées sur des modèles statistiques, sans véritable capacité de raisonnement. Ils ne captent pas les liens implicites entre événements ni la richesse des connaissances de bon sens nécessaires à leur interprétation. Cela entraîne des limitations dans de nombreux domaines, comme la détection des fake news, l’analyse de sentiments et la compréhension du contexte dans les dialogues automatisés. Objectif général L’objectif principal est de développer une approche hybride combinant apprentissage profond et logique symbolique pour permettre à une IA de comprendre et d’interpréter des récits de manière plus fine et contextualisée. En intégrant des modèles de représentation des événements et des règles logiques, ERIANA cherche à doter les machines d’une capacité de raisonnement avancée sur les interactions entre événements, en tenant compte de leurs causes, conséquences et implications. Solutions recherchées Le projet repose sur plusieurs innovations clés: - Création d’un modèle neuro-symbolique combinant réseaux neuronaux et règles logiques pour une meilleure interprétation des conversations - Développement un formalisme permettant de structurer l’information narrative en tenant compte des relations causales et temporelles entre les faits. - Entraînement de modèles d’apprentissage capables d’inférer des connaissances implicite à afin de faire de raisonnement. - Mise en place d’un raisonnement modulaire, inspiré des théories de l’IA symbolique, pour améliorer la compréhension contextuelle des événements. Perspectives et retombées Le projet ERIANA ouvre des perspectives prometteuses, notamment dans les domaines suivants : - Amélioration de la compréhension du langage naturel, avec des applications dans les assistants virtuels, les moteurs de recherche et la génération de textes. - Détection avancée des fausses informations et du discours haineux, grâce à une meilleure analyse des récits et de leurs implications. - Optimisation des systèmes de recommandation et d’analyse de sentiments, en comprenant mieux les avis et opinions des utilisateurs. - Applications sociétales et juridiques, notamment pour l’analyse automatique de textes légaux, la modération de contenus en ligne et la prise de décision basée sur des récits complexes.
Lorsqu’un humain écoute ou lit une conversation en langage naturel, il commence par identifier les entités impliquées, les relations entre ces entités et la manière dont les événements sont formés et interconnectés. Il utilise ensuite ses connaissances générales et son bon sens pour interpréter ce qui se passe et prédire les événements futurs. Ce raisonnement repose sur une combinaison d’observation, de logique et de connaissances implicites.
Le projet ERIANA cherche à reproduire ce processus dans une intelligence artificielle. Notre approche vise à capturer et formaliser les connaissances implicites contenues dans un texte, afin de les structurer dans un cadre facilitant un raisonnement efficace. Pour cela, nous combinons l’intelligence artificielle symbolique (pour assurer la transparence des raisonnements) et l’intelligence artificielle numérique (pour optimiser l’efficacité et l’adaptabilité du modèle).
Méthodologie
Notre démarche repose sur trois volets complémentaires :
1- Représentation et structuration des connaissances. Nous concevons un cadre permettant d’encoder les connaissances générales liées aux entités, relations et événements d’un récit. Pour cela, nous développons un espace ontologique qui modélise les concepts et leurs interactions, en associant chaque élément à des propriétés sémantiques et logiques.
2- Apprentissage et extraction des événements à partir des récits. Nous développons des représentations symboliques des récits, qui permettent de structurer les informations narratives en tenant compte des relations temporelles, causales et logiques entre les faits. Ces représentations sont enrichies à l’aide de modèles d’apprentissage profond capables d’inférer des connaissances implicites à partir de vastes corpus textuels. Nous dévloppons deux approches: i) une approche numérique, basée sur de grands modèles de langage (LLMs), qui apprend à partir de vastes corpus textuels, et ii) une approche neuro-symbolique, qui intègre des règles logiques pour structurer et enrichir le raisonnement de l’IA.
3.- Implémentation d’une couche avancée de raisonnement : Contrairement aux modèles traditionnels qui se contentent d’enchaîner des règles simples, nous développons un système capable de raisonner de manière dynamique et robuste, en prenant en compte le contexte et les interactions entre événements pour améliorer l’interprétation des narrations.
Chaque modèle développé dans ces trois volets fait l’objet d’une validation empirique pour évaluer son efficacité et son impact sur la compréhension des récits.
La liste des articles liés au projet est disponible en accès libre sur HAL et le site web du projet, où se trouvent également les ressources associées.
Avec l’essor des modèles de langage (LLMs), l’attention s’est portée sur leur fine-tuning et leur exploitation pour des tâches linguistiques complexes. Cependant, modéliser précisément les entités, concepts et relations sous forme de vecteurs statiques reste un défi majeur. Nos travaux explorent plusieurs approches d’apprentissage de représentations vectorielles sémantiques, essentielles pour le raisonnement plausible. Nous avons développé plusieurs stratégies d’apprentissage qui ont conduit à plusieurs publications et à la mise à disposition de ressources accessibles gratuitement.
Le langage naturel est une alternative aux logiques formelles pour représenter et exploiter les connaissances. Récemment, l’intérêt s’est porté sur l’extraction de connaissances à partir des LLMs et leur exploitation via des approches de prompting. Nous avons développé un algorithme basé sur la similarité, qui optimise automatiquement le prompt en ajustant ses paramètres en fonction de la représentation des connaissances.
Cependant, raisonner en langage naturel pose un défi, car les méthodes classiques de raisonnement automatisé ne s’y appliquent pas directement. Nous avons donc conçu des modèles de langage basés sur des transformateurs capables de raisonner sur des connaissances exprimées en langage naturel. Par ailleurs, nous avons transformé la tâche de complétion de bases de connaissances en une tâche d’inférence linguistique.
L’utilisation des LLMs pour le raisonnement soulève aussi des préoccupations majeures liées aux biais involontaires, hérités des données d’entraînement. Pour y répondre, nous avons introduit REFINE-LM, une méthode de débiaisation basée sur l’apprentissage par renforcement. REFINE-LM corrige les biais (genre, ethnicité, religion, nationalité) sans nécessiter d’annotations humaines ni de fine-tuning coûteux. Contrairement aux approches existantes, REFINE-LM réduit efficacement les biais tout en préservant la performance des modèles, grâce à un modèle léger entraîné sur la distribution de probabilité des mots. Une démonstration de REFINE-LM a été présentée au grand publique lors de la Conférence Européenne sur l’Intelligence Artificielle et est accessible ici : biasinai.github.io/refinedemo/.
Finalement, les travaux menés dans le cadre d’ERIANA sont également utilisés dans des domaines applicatifs tels que le traitement de documents dans les domaines médical et juridique, ainsi que dans la recherche de nouveaux matériaux en chimie.
Malgré les avancées réalisées dans le cadre du projet ERIANA, les systèmes d’intelligence artificielle continuent de rencontrer des difficultés à capturer les structures conceptuelles fondamentales que les humains utilisent naturellement pour comprendre et interagir avec leur environnement. Nos travaux ont permis d’obtenir des résultats prometteurs en raisonnement automatique sur les récits, avec des applications dans divers domaines, tels que le traitement des documents en milieu médical et juridique, l’extraction de connaissances en chimie, ou encore la réduction des biais dans les modèles de langage grâce à la méthode REFINE-LM.
Toutefois, un constat s’impose : malgré ces avancées, les systèmes actuels peinent encore à structurer leur compréhension du monde de manière aussi fluide et intuitive que le fait l’humain. Pour répondre à ce défi, nous explorons un nouveau cadre de recherche, s’inspirant de la théorie de la cognition incarnée et appliqué aux systèmes d’agents intelligents. Ce cadre repose sur une modélisation de motifs récurrents d’expérience sensorimotrice structurant la cognition humaine. L’objectif est d’adapter les LLMs afin de traduire les descriptions en langage naturel en représentations formelles, basées sur ces motifs sensorimoteurs, pour développer un système neurosymbolique ancrant la compréhension des agents dans des structures conceptuelles fondamentales.
Cette approche ouvre la voie à une meilleure interprétabilité et efficacité des systèmes d’IA, tout en permettant une interaction homme-agent plus intuitive grâce à une compréhension partagée des concepts fondamentaux. Au-delà des applications initialement envisagées dans ERIANA, ce travail marque une avancée vers des modèles d’intelligence artificielle capables de raisonner de manière plus proche du raisonnement humain, renforçant ainsi leur capacité d’adaptation et d’explicabilité.
Donner un sens aux récits du quotidien est une tâche difficile, qui nécessite une compréhension approfondie de la langue et des connaissances de bon sens. Alors que les humains peuvent s'appuyer sur un raisonnement de haut niveau pour tirer des conclusions, les modèles actuels manquent largement de cette capacité. Les connaissances de bon sens jouent un rôle crucial dans l'interprétation des récits, qui « apparaissent » en tant qu'hypothèses et attentes supplémentaires et peuvent être utilisées « à la volée » lors de l'élaboration d'un raisonnement de haut niveau (au niveau du contexte) sur les événements d'un récit. La majorité des approches existantes de compréhension du langage se concentrent principalement sur l'exécution de formes de raisonnement de bas niveau (au niveau de la phrase) pour accomplir des tâches. Cependant, si nous voulons aller de l'avant, nous avons besoin de capacités de raisonnement de haut niveau qui combinent les connaissances de bon sens d'une manière efficace.
Ce projet vise à développer une approche de raisonnement de haut niveau sur les récits du quotidien. Le raisonnement sur les récits est centré sur l'événement, qui repose intrinsèquement sur les possibilités d'événement (aspects ou attentes) et les interactions (par exemple, causalité ou temporelle) entre les événements. Je développerai d'abord un cadre de représentation neuro-symbolique des récits qui permet d'encoder les événements ainsi que leurs affordances, et les interactions entre eux de manière interprétable. Sur la base d'un tel cadre, je développerai ensuite des modèles génératifs menant à la découverte de connaissances qui peuvent être considérées comme des règles symboliques. Une fois apprises, ces règles seront combinées en utilisant des modèles experts (Mixture-of-Experts) pour mettre en œuvre des méthodes de raisonnement de haut niveau, de la même manière que les règles sont enchaînées dans un formalisme logique.
Coordination du projet
Zied Bouraoui (Centre de Recherche en Informatique de Lens)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
CRIL Centre de Recherche en Informatique de Lens
Aide de l'ANR 432 756 euros
Début et durée du projet scientifique :
février 2023
- 48 Mois