TCOM - Télécommunications

– MAPE

Résumé de soumission

L'étude des échanges pair-à-pair (P2P) gérés par les systèmes existants est une problématique clé pour de
nombreuses applications. En particulier, il est aujourd'hui largement reconnu que de grandes quantités de
contenus pédophiles sont distribués dans de tels systèmes, ce qui soulève des problèmes sociétaux
importants. Un autre problème important est l'impact de l'énorme quantité de trafic généré par ces
systèmes, estimé entre 60 et 70 % de l'ensemble du trafic internet actuel. Le gérer de façon appropriée est
par conséquent un enjeu clé pour les fournisseurs de service Internet. Malgré cela, on sait aujourd'hui très
peu de choses sur les échanges P2P : leur grande taille, leur nature distribuée, et le manque de
documentation font de la collecte de grands ensembles de données sur ces échanges un défi majeur.
Manipuler et analyser de telles données est également un défi, à la fois à cause de leur taille et d'un
manque d'outils méthodologiques et pratiques. L'objectif de notre projet est de remédier à cet état de fait en
conduisant des mesures à grande échelle des échanges P2P et en développant des méthodes d'analyse
aptes à en extraire l'information pertinente. Nous ciblerons particulièrement les besoins sociétaux et
industriels cités ci-dessus, qui indiquent les directions clés pour notre recherche et permettront d'évaluer
nos contributions. Nous utiliserons quatre méthodes de mesure complémentaires, basées sur deux
approches distinctes (work packages 1 et 2). Les données obtenues surpasseront celles disponibles
jusqu'ici de plusieurs ordres de grandeur, à la fois en nombre d'utilisateurs/fichiers concernés, en durée, et
en qualité. Nous mettrons la plupart de ces données à la disposition de la communauté scientifique, ce qui
constituera une contribution importante (et nous assurera une forte visibilité internationale). Les données
collectées peuvent être analysées aux niveaux applicatif et réseau, qui apportent des éclairages différents.
Nous considérerons les deux (work packages 3 et 4), et développerons les outils d'analyse appropriés,
avec deux applications cibles : la lutte contre les échanges pédophiles et la caractérisation de trafic. En
complément des méthodes statistiques classiques, nous utiliserons les deux méthodes plus subtiles qui ont
déjà prouvé leur efficacité dans ce contexte : l'analyse de graphes et l'apprentissage automatique. Nos
principales productions seront les données rendues disponibles, et les publications décrivant nos méthodes
et leurs applications. Mais nous développerons aussi des prototypes avancés démontrant des applications
clés de nos contributions. Nous produirons notamment un système de notation des contenus et de
détection de fakes, capable d'identifier des fichiers similaires à des fichiers donnés. Concernant la
caractérisation de trafic, notre objectif est d'aboutir à un prototype capable d'identifier des classes de trafic
P2P. Nous focaliserons en particulier sur la détection de groupes de pairs partageant des objets de même
type, et nous rechercherons des facteurs influençant ce trafic, afin de mettre au point des politiques de
gestion appropriées. En plus de ces travaux de recherche, nous traiterons un ensemble de problèmes dans
un work package séparé (WP0). Son objectif est d'assurer le bon déroulement du projet, dans les délais
prévus. Il organisera des réunions biannuelles, produira les rapports associés, et gèrera tous les problèmes
rencontrés au cours du projet, y compris les problèmes éthiques et légaux. Il assurera également la
diffusion et la valorisation de nos résultats, au travers de publications sur un site web dédié, de rapports
grand public, et de relations avec des partenaires extérieurs (notamment des institutions de protection des
enfants). Une autre de ses tâches importantes est d'assurer que le projet tirera profit de la complémentarité
entre les résultats de chaque work package, et de chaque partenaire. En effet, les nombreuses relations
entre nos différents travaux fournissent des opportunités d'en augmenter significativement la portée. Enfin,
il sera aussi responsable de la mise en place de moyens de stockage et d'accès appropriés aux énormes
quantités de données collectées : il fournira un système de stockage compact et sûr, avec une interface
efficace pour tout les partenaires (et les extérieurs, pour les données publiques). Les équipes impliquées
dans ce projet ont une expertise reconnue et complémentaire dans les domaines de la mesure et de
l'analyse. Ils ont déjà conduit des travaux démontrant la faisabilité du projet. Ils rassemblent des
compétences en réseaux, en algorithmique distribuée, en analyse de graphes, en apprentissage
automatique, et en analyse de trafic, qui constituent le socle sur lequel notre projet est construit.

Coordinateur du projet

Matthieu LATAPY (UNIVERSITE PARIS VI [PIERRE ET MARIE CURIE])

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

UNIVERSITE PARIS VI [PIERRE ET MARIE CURIE]
INSTITUT NATIONAL DE RECHERCHE EN INFORMATIQUE ET EN AUTOMATIQUE - INRIA

Aide de l'ANR 1 302 134 euros
Début et durée du projet scientifique : - 36 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter