Flash Info
RNTL - Réseau National en Technologies Logicielles

claSsification Et Visualisation puor l'Exploration et la Navigation – SEVEN

Résumé de soumission

1) Introduction

SEVEN a pour but de faciliter l?exploration de grands volumes de données ou de résultats d?analyses complexes pour des utilisateurs non-spécialistes du traitement des données ou d?un domaine d?étude. Les données sont symboliques, il s?agit de documents textuels ou de documents auxquels on a pu associer des représentations symboliques (métadonnées bibliographiques, mots-clés?). Lors de la navigation et par le biais d?annotations, l?utilisateur se construit sa représentation des données et ses jugements sont capitalisés et éventuellement recyclés dans des applications commerciales aval.

SEVEN va réunir des travaux déjà bien avancés dans les domaines de l?analyse linguistique, de la classification de données symboliques et de visualisation interactive pour la fouille de données afin de les intégrer au sein d?une application homogène. Cette application sera composée des constituants suivants : analyseur et interpréteur linguistique, classifieur hiérarchique avec possibilité d?appartenance à plusieurs classes et visualisation interactive pour l?expert avec facilités d?annotation ou pour le commercial sur une version préanalysée des données. Afin d?assurer la cohésion des apports, un format d?échange de données sera définit et une application sera spécialement dédiée à la possibilité de rétroagir sur l?analyse des données et leurs analyses à partir de leurs formes visuelles.
Mots-clés:
2.3 - Métamodélisation et adaptation
2.9 - Bases de données images, texte, son, photo
2.11 - Métadonnées et ontologies

2) Objectifs de recherche du projet

SEVEN va proposer des avancées originales sur les points suivants :
L?analyse linguistique pour l?extraction d?index pertinents en classification symbolique et des méthodes d?évaluation de la qualité des index ;
La classification à des fins de visualisation en construisant une structure de classification spatiale. Dans un premier temps, les prototypes obtenus précédemment seront utilisés, puis la structure sera élargie par l?ajout des nouvelles unités à classifier ;
La visualisation interactive pour la fouille de données en construisant des interfaces d?accès à des classifications hiérarchiques empiétantes à différents niveaux de détail avec un passage fluide entre ces niveaux ;
La rétroaction de l?analyse sur le traitement des données par la capitalisation incrémentale des annotations pour constituer de nouvelles ressources d?analyse et de représentation des données. Elle permettra aussi à l?analyste de modifier et d'adapter le comportement des modules d'analyses au corpus.

3) Objectifs industriels

Le projet permettra de construire une application d'analyse, de visualisation et d'exploitation de données symboliques pour l'acquisition d'expertise sur des domaines d?activités, pour la définition de stratégies commerciales en direction de ces domaines ou pour la veille concurrentielle. Dans une perspective plus large, ce projet réalisera une application d'analyse et de fouille visuelle de gros volumes de données symboliques utilisable à des niveaux experts (avec annotation et personnalisation) ou applicatifs (avec parcours simplifié et prise de connaissances efficace).

4) Partenaires, compétences

Les partenaires sont composés de trois laboratoires de recherche (CEREMADE, INRIA FUTURS et LIMSI-CNRS) et deux industriels (EDF-R&D et SEMIOSYS) dont les complémentarités se situent à la fois sur le plan des thématiques (analyse linguistique, classification, visualisation et standardisation des données) du projet et sur les niveaux d'intégration (conception, développement, intégration, expérimentation).
* le LIMSI-CNRS contribue sur deux thématiques associées à deux groupes de recherche de ce laboratoire:
- le groupe LIR sur l'amont, l'analyse linguistique des documents, leur simplification et leur enrichissement par des concepts qui en préparent la classification.
- le groupe AMI sur la visualisation des documents à partir de la classification et à

Coordination du projet

GE (grande entreprise)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

Aide de l'ANR 484 017 euros
Début et durée du projet scientifique : - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter