DS0709 - Réseaux numériques à hautes performances

Théorie des Matrices Aléatoires pour les Graphes de Grande Taille – RMT4GRAPH

Résumé de soumission

RMT4GRAPH a pour objectif de développer un cadre original d'analyse théorique des grands graphes aléatoires. Cette analyse permet alors d'étudier les performances ainsi que les possibilités d'amélioration d'un vaste ensemble de méthodes de traitement du signal et apprentissage automatisé pour le Big Data. L'ingrédient essentiel permettant ces considérations théoriques est l'exploitation efficace des multiples degrés de liberté disponibles dans les données, permis par les avancées récentes en théorie des matrices aléatoires. Le cœur technique du projet se divise ainsi en deux parties.

D'une part, une étude mathématique de plusieurs classes de modèles matriciels aléatoires liées aux graphes sera effectuée. Précisément, cette étude comprend, de façon non exhaustive: (i) la convergence de matrices à noyaux (vues comme es matrices d'adjacence de graphes), générées par un grand nombre d'observations vectorielles larges, vers une limite matricielle déterministe, ainsi que des résultats de convergence au second ordre (théorèmes de la limite centrale) pour des fonctionnelles bien choisies de ces matrices, (ii) la distribution limite des valeurs propres de matrices aléatoires non hermitiennes à entrées indépendantes ou faiblement dépendantes, qui prennent la forme de matrices d'adjacence ou de Laplace de graphes aléatoires, (iii) la caractérisation des valeurs propres isolées d'une certaine famille de matrices de graphes en lien avec les matrices de covariance empirique de données extraits de graphes, (iv) l'analyse de nouveaux modèles de matrices aléatoires spécifiques aux problèmes d'apprentissage automatisé, etc.

D'autre part, une classe d'applications en traitement du signal et apprentissage automatisé ayant de fortes connections avec les graphes sera considérée. Parmi elles, nous analyserons les méthodes spectrales de classification de données; ces techniques sont basées sur l'extraction de valeurs et vecteurs propres d'une matrice d'adjacence de type matrice à noyau mettant en jeu l'affinité entre données. Notre but est de montrer que l'exploitation des degrés d'aléa dans les données induisent une classification parfaite dans la limite des grandes et nombreuses données, à partir de quoi des statistiques de second ordre donneront des indicateurs de performance et des solutions d'amélioration pour des dimensions finies. Un deuxième problème concerne les réseaux de neurones dits echo-state qui sont aujourd'hui plus attrayants que les réseaux de neurones classiques et reposent sur un graphe de nœuds connectés aléatoirement. L'étude consiste ici en l'analyse de la distribution des valeurs propres pour des modèles hermitiens ou non de matrices d'adjacence et de Laplace de tels graphes, qui contiennent des information sur la stabilité et la performance des réseaux neuronaux. Par ailleurs, certains nouveaux modèles matriciels qui apparaissent naturellement dans ce cadre seront aussi étudiés. En termes de traitement du signal, le récent domaine du traitement des signaux sur graphes, consistant en le filtrage de signaux définis sur des graphes et non temporellement, ainsi que celui du scannage de graphes, consistant en l'évaluation de statistiques obtenues à partir de données extraites sur des graphes, seront étudiés via les analyses respectives de modèles matriciels de Laplace de de Gram (principalement des matrices de covariance empirique modifiées, adaptées aux graphes).

L'ambition à long terme de RMT4GRAPH est de développer un cadre plus vaste d'analyse d'outils pour le Big Data reposant sur des techniques de matrices aléatoires exploitant les degrés d'aléas dans le modèle, de manière similaire à ce qui existe aujourd'hui en acquisition de données parcimonieuses. Le présent projet sert ainsi de support à la constitution future d'un groupe de recherche avancée dans le domaine du traitement de grandes données.

Coordination du projet

Romain Couillet (ECOLE SUPERIEURE D´ELECTRICITE (SUP)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

ECOLE SUPERIEURE D´ELECTRICITE (SUP

Aide de l'ANR 306 572 euros
Début et durée du projet scientifique : septembre 2014 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter