Génération de questions pour la compréhension textuelle par lecture automatique – QUANTUM
Génération de questions pour la compréhension textuelle par lecture automatique
Le projet vise à étudier la tâche de génération de questions, dans une approche abstractive, à<br />l’échelle des passages textuels (“passage-level abstractive question generation”). Le projet est<br />focalisé sur la manière de générer des questions dont la réponse est potentiellement distribuée<br />dans un ou plusieurs textes et où les mots qui composent la question ne sont pas nécessairement<br />présents dans le texte d'origine.
La surabondance actuelle de données textuelles rend difficile la recherche de la réponse correcte à une requête de l'utilisateur. Dans ce contexte, la génération de questions (la capacité de générer automatiquement des questions à partir d'un document) gagne rapidement en popularité en tant que technologie clé. Ce projet vise à étudier la tâche de génération de questions abstractives au niveau d'un passage : c'est-à-dire dont la réponse est distribuée dans le texte. On développera des approches de lecture automatique qui prennent en compte la structure du document (à la fois typographiquement et rhétoriquement) et génèrent des questions complexes qui reposent de manière inhérente sur cette structure. Afin d'entraîner nos modèles, on construira des jeux de données et des annotations pertinentes avec une supervision limitée. Nos modèles seront évalués à la fois intrinsèquement et en les intégrant dans un agent conversationnel, en tant que banc d'essai in vivo. En développant des modèles plus avancés pour la génération de questions allant au-delà de l'état actuel des connaissances, notre objectif est d'améliorer de nombreuses applications industrielles et sociales : le type de génération de question complexe que nous souhaitons résoudre constituerait un atout important pour la construction et l'enrichissement automatiques de bases de connaissances utilisées par les agents conversationnels, les systèmes d’aide à la décision et les systèmes de réponse aux questions techniques.
Coordination du projet
SYNAPSE DEVELOPPEMENT (PME (petite et moyenne entreprise))
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
UMR 7503 - LORIA Laboratoire lorrain de recherche en informatique et ses applications (LORIA)
SYNAPSE DEVELOPPEMENT
IRIT Institut de Recherche en Informatique de Toulouse
Aide de l'ANR 436 642 euros
Début et durée du projet scientifique :
septembre 2019
- 48 Mois