Cotation, Analyse, Hiérarchisation et Ontologies pour le Renseignement et la Sécurité – CAHORS
« Le Web est le modèle qui figure le mieux l'activité du terrorisme mondial. Il est non seulement en totale adéquation avec la structure de la mouvance terroriste. Mais il est surtout devenu pour elle un vecteur à tout faire. » (Livre blanc du Gouvernement sur la sécurité intérieure face au terrorisme, 2006). Partant de ce constat, il s'agit pour les services gouvernementaux concernés par la veille anti-terroriste, comme par la criminalité organisée, de se doter de moyens techniques adéquats leur permettant de s'adapter aux mutations technologiques dont l'Internet est le reflet : fort accroissement des volumes de données disponibles, intensification des flux de données et multiplication des sources d'informations souvent mal répertoriées. Pour le renseignement, qu'il soit militaire ou économique, cette nouveauté implique un traitement particulier de ces nouvelles sources nécessairement mal caractérisées, mais à la puissance potentiellement très large.
Leur qualité doit en particulier être évaluée, avec la difficulté d'un traitement automatique d'un ensemble de sources devenu gigantesque mais ardu à caractériser. Pour pouvoir faire face à l'accroissement des volumes de données, dont la grande majorité est de nature non structurée, et parvenir à une automatisation du processus de cotation, il est indispensable de se doter d'une stratégie globale de maîtrise de l'information. Plusieurs défis se trouvent dès lors à relever. Des outils de filtrage et d'analyse de données textuelles doivent d'une part permettre la recherche efficace d'informations spécifiques et d'autre part garantir la structuration des informations en fonction des besoins applicatifs. Cette phase de structuration est essentielle pour permettre un traitement automatisé d'informations exprimées en langage naturel.
Des fonctions plus évoluées de traitement de l'information en vue de sa valorisation en renseignement sont en deuxième lieu nécessaires dans une optique de surveillance d'une menace diffuse, croissante et protéiforme : signaux faibles de crise, réseaux sociaux à visée criminelle en cours de constitution, diffusion de rumeurs voire tentatives de désinformation sont autant d'éléments qu'il s'agit de déceler précocement au sein de la masse de l'information collectable en source ouverte, et des méthodes et outils doivent permettre d'instrumenter ces investigations. Des modes de représentation ergonomiques doivent assurer la visualisation des informations générées automatiquement. Ce point est capital dans la mesure où ces informations sont destinées à un utilisateur qui validera en dernier lieu la valorisation de l'information. Il faut donc lui offrir les moyens de mieux appréhender la situation, de connaître les éléments sur lesquels se fondent l'analyse automatique et de raisonner à partir de cette analyse.
Enfin, une plate-forme logicielle doit assurer l'interconnexion de ces différents outils pour que l'ensemble de la chaîne de traitement puisse être véritablement maîtrisée. Le projet CAHORS propose de relever chacun de ces défis techniques, à la fois dans une optique de protection du citoyen face aux menaces terroristes ou criminelles, et pour assurer que la première étape de la gestion de crise potentielle, celle de l'anticipation et de la détection des signes précurseurs, soit idéalement franchie pour une meilleure prévention des risques.
Coordinateur du projet
Monsieur Philippe CAPET (ETI (entreprise de taille intermédiaire))
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
OFFICE NATIONAL D'ETUDES ET DE RECHERCHES AEROSPATIALES [ONERA] - CENTRE D'ETUDES ET DE RECHERCHES DE TOULOUSE
CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - DELEGATION REGIONALE ILE-DE-FRANCE SECTEUR PARIS A
Aide de l'ANR 1 211 727 euros
Début et durée du projet scientifique :
- 36 Mois