MDCO - Masse de données Connaissances Ambiantes

Indexation, catégoratisation et organisation de documents multimédia – OMNIA

Résumé de soumission

Le projet Omnia vise à filtrer des documents contenant du texte et des images, dans un contexte de
grandes masses de données, tels que ceux trouvés dans des intranets et sur Internet, et à les présenter
aux utilisateurs dans un outil de traitement de contenu comme DocuShare (Xerox). L'originalité du projet
est de travailler sur 3 dimensions : image, texte, émotion et dans un contexte multilingue. L'image et le
texte donnent lieu à 2 catégorisations relatives aux aspects informationnels et aux aspects émotionnels
spécifiques (provenant directement de l'image, ou afférents à sa perception exprimée dans le texte). Ces
deux types de contenus seront traités indépendamment (annotation puis indexation et catégorisation),
avec des techniques d'apprentissage, et ensuite fusionnés au niveau de l'outil de filtrage et
d'interrogation. Leurs "primitives" seront reliées à une représentation interlingue des sens de mots
fondée sur l'anglais (UNL), ce qui ouvrira la voie au multilinguisme de la "publication" des catégories des
documents, et du traitement de questions dans les langues naturelles munies de dictionnaires UNL.

Coordination du projet

Luca MARCHESITTI (ETI (entreprise de taille intermédiaire))

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Aide de l'ANR 593 102 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter