CE23 - Intelligence Artificielle

Supervision Distante pour les Compte-Rendus Enrichis de Relations Rhétoriques – SUMM-RE

Résumé de soumission

Il devient de plus en plus réaliste d'exploiter les données transcrites pour des tâches qui exigent la compréhension de ce qui est dit lors d’une conversation. SUMM-RE combinera expertise en théories du discours et avancées récentes dans le domaine de l’apprentissage basé sur la supervision distante pour améliorer la production automatique de comptes rendus.

Les approches de pointe en matière de résumé abstrait traitent le discours comme une simple séquence linéaire d'énoncés. SUMM-RE postule qu'en exploitant les informations sur les relations discursives et les riches structures déterminées par les relations entre les énoncés, nous pouvons améliorer considérablement les modèles de résumé abstrait. Le manque de données de formation appropriées constitue un obstacle majeur à l'élaboration de modèles plus sophistiqués de structure discursive pour les conversations parlées et multipartites. SUMM-RE abordera ce problème de deux manières. Premièrement, il créera un nouveau et unique corpus d'interactions de type réunion en français. Deuxièmement, il étiquettera ce corpus et un vaste corpus d'interactions de type réunion en anglais pour la structure du discours. L'approche d'annotation étendra les développements récents en matière de supervision à distance pour développer des fonctions d'étiquetage qui peuvent être utilisées pour étiqueter automatiquement de grandes quantités de données. Cette approche présente l'avantage très intéressant d'exploiter l'expertise linguistique tout en limitant au maximum l'annotation manuelle.

Les données annotées automatiquement seront utilisées pour améliorer les algorithmes tant pour les résumés de sujets courts que pour les comptes rendus de réunions plus détaillés. Ces algorithmes seront à leur tour intégrés dans l'outil de résumé semi-automatique du partenaire principal (LINAGORA) afin d'améliorer considérablement le résultat pour ses utilisateurs. Les résultats du projet (corpus et algorithmes) seront diffusés sous licence open-source dans le cadre de l'offre LinTo/ Conversation Manager de LINAGORA.

Coordinateur du projet

Madame Julie Hunter (LINAGORA GRAND SUD OUEST)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LPL Laboratoire Parole et Langage
IRIT Institut de Recherche en Informatique de Toulouse
LINA LINAGORA GRAND SUD OUEST
LIX Laboratoire d'Informatique de l'Ecole Polytechnique

Aide de l'ANR 669 891 euros
Début et durée du projet scientifique : décembre 2020 - 42 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter