DS0707 - Interactions humain-machine, objets connectés, contenus numériques, données massives et connaissance

Extraction de connaissances à partir de vastes corpus de conversations “chat” client-opérateurs – DATCHA

Résumé de soumission

Le but du projet DATCHA est de permettre l’extraction de connaissance à partir de très vastes corpus de conversation de type “chat” entre des clients et des opérateurs. Extraire des connaissances dans ce contexte demeure un défi pour les méthodes de traitement automatique des langues. Les méthodes de fouille de texte classique sont clairement sous-optimales en ne prenant en compte, ni la dimension interactive, ni les propriétés de ce nouveau type de de langage à l’intersection du langage écrit et parlé.
Le projet DATCHA va répondre à ces défis à travers des analyses profondes pour une conversation au niveau syntaxique, sémantique et discursif et pour des collections de conversations en définissant des mesures de similarités sémantiques et discursives. Les solutions innovantes développées seront évaluées dans le contexte des centres de relation clientèle d’Orange sur plusieurs cadres applicatifs tels que la génération de rapports, la prédiction de succès d’un dialogue et l’aide en ligne.

Coordinateur du projet

Monsieur FREDERIC BECHET (Laboratoire d'Informatique Fondamentale de Marseille)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

AMU Laboratoire d'Informatique Fondamentale de Marseille
UPS-IRIT Université Toulouse III [Université Paul Sabatier]
ORANGE

Aide de l'ANR 409 806 euros
Début et durée du projet scientifique : septembre 2015 - 42 Mois

Liens utiles