CORD - Contenu et interaction 2009

Amélioration de la qualité, de la robustesse et de l'acceptabilité des systèmes de traduction automatique par traitement des erreurs en source et intégration de capacités de diagnostic et d'auto-évaluation. – TRACE

Résumé de soumission

L'avènement d'un média global, le Web, et l'explosion des contenus numériques en ligne provoquent une mutation sans précédent des pratiques de communication, d'échange d'information, voire de sociabilisation, qui s'affranchissent de plus en plus des distances physiques et des frontières. En découle un accroissement des besoins en traduction, besoins qui sont souvent non solvables, éphémères, et donc pas nécessairement destinés à être couverts par des traducteurs professionnels: une traduction instantanée, portable, à bas coût (voire gratuite), robuste à tous les types d'entrées, en particulier aux types d'écrits électroniques qui prolifèrent sur Internet (commentaires de blogs, de sites collaboratifs (Wikipedia), de forums, critiques sur Allocine.fr, etc). Les utilisateurs finaux de ces technologies changent et sont certainement plus jeunes, plus technophiles, et moins regardants (sourcilleux) sur la précision et sur la correction des traductions produites que des utilisateurs traditionnels de service de traduction. Ces technologies profitent aussi aux éditeurs de contenus, en leur permettant d'étendre et d'internationaliser leur public à très faible coût. L'augmentation de la quantité de contenus générés par les utilisateurs brouille également les frontières entre les traductions amateur et professionnelle (un exemple en est donné par les tentatives de 'crowdsourcing' de la traduction de l'interface de Facebook), suscitant une demande pour des outils de traduction automatique, mais également pour des outils de contrôle de la qualité des traductions humaines. En réponse à ces besoins, la technologie a fait des progrès considérables, en particulier sous l'impulsion du développement des techniques statistiques de fouille et d'exploration de corpus parallèles et comparables, créant les conditions d'une diffusion quasi universelle des outils de traduction, notamment à travers les services de traduction en ligne des opérateurs des grands moteurs de recherche, au premier lieu desquels Google, Microsoft, Yahoo, etc. En dépit de ces progrès et de l'utilisation massive de ces services en ligne, la traduction automatique conserve une mauvaise presse, la qualité des traductions produites faisant régulièrement l'objet de dénonciations ironiques, le plus souvent fondées sur l'exploitation de quelques exemples bien choisis. Dans ce contexte l'objectif du projet TRACE est double: 1. il vise à améliorer la robustesse des outils de traduction automatique en intégrant des modules de correction et de reformulation, afin de rendre les textes électroniques traduits plus compatibles avec les attentes des systèmes de traduction automatique, qui ont jusqu'à présent été développés pour traiter des textes 'propres', 2. il vise également à améliorer l'acceptabilité et à faciliter la diffusion de ces technologies auprès du plus grand public. Prenant acte du fait que la traduction automatique n'atteindra jamais la qualité de la traduction faite par des traducteurs humains, il vise à développer des services de traduction automatique introspectifs, capables de percevoir leurs limites et leurs faiblesses et d'en rendre compte, et ouverts à une aide des utilisateurs. Ceci présuppose en premier lieu de développer des outils d'évaluation diagnostique. Ce projet s'appuie sur l'expertise complémentaire en matière de traduction automatique des deux partenaires du projet, qui disposent également d'outils de correction automatique, aussi bien pour ce qui concerne la typographie, l'orthographe et la grammaire. Il s'appuie également sur le succès de la plate-forme de traduction en ligne de Reverso, qui permet une étude privilégiée de ces nouveaux besoins de traduction automatique. Il associe recherche académique et recherche appliquée, dans un cycle de développement court, incluant la possibilité d'expérimenter en grandeur réelle tout au long du projet.

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Aide de l'ANR 471 687 euros
Début et durée du projet scientifique : - 0 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.