ChairesIA_2019_2 - Chaires de recherche et d'enseignement en Intelligence Artificielle - vague 2 de l'édition 2019 2020

Générer du texte dans différentes langues, à partir de différentes sources – XNLG

Résumé de soumission

La génération en langue naturelle (GLN) produit du text à partir de données, de textes ou de représentations sémantiques. Avec l'essor de l'IA et de l'apprentissage profond, le domaine de la GLN s'est développé à une vitesse exponentielle. Si la GLN a de nombreuses applications possibles (résumé automatique, verbalisation des données, simplification de textes, robo-journalisme, narration d'histoires, etc.), des questions de recherche essentielles restent en suspens, telles que la manière de gérer le manque de données d'apprentissage et l'expansion de la génération de textes aux multiples langues naturelles. En utilisant des technologies neuronales à la pointe de la technologie (modèles de langue BERT, architectures décodeur-décodeur, apprentissage multitâche et par transfert), XNLG vise à (i) développer des méthodes permettant de compenser le manque de données d'apprentissage et (ii) développer des modèles pour la génération multilingue et multisource, c.-à-d. des modèles pour la génération en plusieurs langues et à partir de représentations de signification (RS2T), de texte (T2T) ou de données (D2T). Nous examinerons en particulier si une représentation sémantique unique (RS) peut être utilisée comme entrée pour la génération dans plusieurs langues et comment elle se compare à la génération à partir de RS dépendant de la langue; dans quelle mesure les modèles que nous proposerons pour la génération RS2T s’étendent à la génération à partir de données ou de textes; et si les RS fournissent une meilleure base pour la génération que les puissantes représentations continues actuellement créées pour les phrases par des modèles neuronaux tels que BERT et ELMO.

Coordination du projet

Claire GARDENT (Laboratoire lorrain de recherche en informatique et ses applications (LORIA))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

UMR7503 Laboratoire lorrain de recherche en informatique et ses applications (LORIA)

Aide de l'ANR 402 933 euros
Début et durée du projet scientifique : août 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter