CORD - Contenu et interaction 2009

Enrichissement Dynamique de ressources Lexicales – EDyLex

Résumé de soumission

La question centrale abordée dans ce projet est l'acquisition dynamique de nouvelles entrées lexicales dans des lexiques existants utilisés dans des chaînes d'analyse linguistiques (analyse syntaxique et sémantique ou systèmes de transcription de la parole) : comment détecter et qualifier un mot inconnu ou une entité nommée nouvelle dans un texte ou dans un flux de parole ? Comment lui attribuer une phonétique, une catégorie, des propriétés syntaxiques, une place dans un réseau sémantique ? Pour répondre à ces questions, le consortium réuni pour EDyLex explorera aussi bien les méthodes symboliques que les techniques d'apprentissage statistiques sur corpus, le principe sous-jacent étant que le croisement de méthodologies peut et doit permettre l'efficacité maximale. Le contexte applicatif choisi est celui des dépêches de l'Agence France-Presse (AFP). Par sa richesse (multilingualité et multimodalité), il est considéré comme représentatif de la problématique de l'incomplétude lexicale et de la création rapide de thésaurus métier. L'enjeu applicatif principal des méthodes et outils développés au sein d'EDyLex est l'automatisation de la création d'ontologies pour les gestionnaires de contenu multimédia (médias, industrie aéronautique, monde médical...). En effet, disposer de telles ressources décrivant ses connaissances et son métier est à la fois indispensable pour chaque domaine de spécialité et extrêmement coûteux en temps et en ressources. EDyLex est porté par l'équipe Alpage, spécialisé dans le développement d'analyseurs de textes écrits et des ressources associées (lexiques, grammaires), et s'organise autour d'un partenariat avec deux grands laboratoires, le LIF et le LIMSI, composés tous deux de linguistes-informaticiens spécialistes de l'écrit et de l'oral et avec trois entreprises, Vecsys Research (recherche industrielle en Traitement de la Parole), Syllabs (Ingénierie des langues pour les NTIC) et l'Agence France-Presse, partenaire utilisateur, validateur et fournisseur de contenu.

Coordination du projet

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

Aide de l'ANR 754 754 euros
Début et durée du projet scientifique : - 0 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter