MDCO - Masse de données Connaissances Ambiantes 2007

Captation, Analyse et Représentation Temporelle des Évolutions d'un Corpus – CARTEC

Résumé de soumission

CARTEC est un projet de recherche industriel dont l'objet est l'analyse de la variation temporelle des
ensembles documentaires hypermédia qui évoluent de façon anarchique afin de les transformer en
corpus, c'est-à-dire en une ressource construite et exploitable.
Cette transformation pose trois problèmes majeurs qui constituent les trois sous-projets d'innovation
autour desquels le projet est architecturé :
1. la captation de l'information dans un ensemble documentaire non maîtrisé dont l'évolution est
inconnue et variable selon les documents ;
2. l'indexation de l'information, afin de permettre la recherche et la navigation dans le corpus,
mais aussi afin d'analyser son évolution ;
3. le stockage, le codage et la représentation temporelle des résultats d'une recherche.
Compte tenu des contraintes techniques propres à chacune de ces problématiques et tout
particulièrement la différence de vitesse de traitement qui peut y avoir entre la captation et l'analyse, il
est essentiel de faire fonctionner les différents modules constitutifs de la solution de façon asynchrone
avec un couplage lâche tout en mettant en place des mécanismes de pilotage et de configuration
automatique croisée. Ainsi par exemple l'analyse des variations des documents réalisées lors de
l'indexation servira à définir la fréquence de captation d'un document.
Cartec placera l'ensemble de ses travaux de recherche et d'innovation dans le cadre concret du suivi et
de l'indexation temporelle du Web, ce contexte applicatif permettant de se focaliser sur des
débouchés industriels et commerciaux de type veille d'information à grande échelle.
Cartec dispose par d'un cadre structurant validera l'ensemble des travaux sur le cas concret de
l'archivage du Web tel qu'il relève de la mission de l'INA dans le cadre du dépôt légal.
Enfin, Cartec privilégie un travail d'innovation itératif selon des cycles courts permettant de réaliser des
avancées concrètes et de les injecter rapidement dans les produits des partenaires du projet. Ce mode
opérationnel permet de tirer pleinement avantage de la durée choisie (36 mois) pour construire une
vision à long terme et de planifier des résultats à court terme en ligne avec les ambitions et les projets
industriels des partenaires.

Coordination du projet

PME (petite et moyenne entreprise)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

INSTITUT NATIONAL DE L'AUDIOVISUEL (INA)

Aide de l'ANR 597 000 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter