CE23 - Intelligence artificielle et science des données

Simplification Automatique de Textes Scientifiques – SimpleText

Résumé de soumission

Les systèmes d'information donnent aux citoyens un accès à des informations provenant de sources fiables telles que la littérature scientifique. Cette dernière est difficilement accessible aux non-experts en raison de sa complexité langagière et du manque d’acculturation scientifique. Des décisions individuelles ou politiques peuvent être impactées par une méconnaissance des travaux scientifiques, comme pendant la pandémie du COVID-19. La simplification automatique de textes se donne pour objectif de réduire ces obstacles et pourrait être utile dans divers domaines tels que la communication et le journalisme scientifique, la politique et l'éducation. SimpleText sera une avancée pour rendre la recherche véritablement accessible et compréhensible pour tous et contribuera à contrer les fake news fondées sur des résultats scientifiques (ODD ÉDUCATION DE QUALITÉ). Les textes simplifiés sont également plus accessibles aux locuteurs non natifs, jeunes lecteurs et personnes souffrant de troubles de la lecture (ODD INÉGALITÉ RÉDUITE). SimpleText vise à répondre aux questions de recherche suivantes : RQ1 - Quelles expressions textuelles porteuses d'information doivent être simplifiées (documents et passages à inclure dans le résumé simplifié) ? RQ2 - Quels types d'information de base devraient être fournis (quelles notions devraient être contextualisées en donnant une définition, une application, un exemple etc.) ? RQ3 - Comment améliorer la lisibilité d'un texte court donné (e.g. en réduisant le vocabulaire et la complexité syntaxique) avec un taux acceptable d’altération de l'information ? RQ4 - Dans quelle mesure les approches utilisées pour l'anglais sont-elles applicables au français ? Répondre à ces questions présuppose de fournir des algorithmes, des données et des mesures qui seront valorisés lors de campagnes d'évaluation internationales (e.g. CLEF), ainsi que pendant les cours des humanités numériques, localisation de sites web, pré-édition et rédaction technique.

Coordination du projet

Liana ERMAKOVA (Université de Brest (UBO); Laboratoire Histoires et Constructions dans le Texte (HCTI))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

University of Minho
UBO-HCTI Université de Brest (UBO); Laboratoire Histoires et Constructions dans le Texte (HCTI)
UAPV-LIA Université Avignon et Pays du Vaucluse (UAPV); Laboratoire d'Informatique d'Avignon
UBS-HCTI Université Bretagne Sud (UBS), Laboratoire Héritages et Constructions dans le Texte et l'Image (HCTI)
AMU-LIS Université Aix-Marseille (AMU), Laboratoire Informatique et Systèmes (LIS)
University of Amsterdam

Aide de l'ANR 295 557 euros
Début et durée du projet scientifique : janvier 2023 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter