ChairesIA_2019_1 - Chaires de recherche et d'enseignement en Intelligence Artificielle - vague 1 de l'édition 2019

Apprentissage machine/profond pour données hétérogènes à grande échelle – AML-HELAS

Résumé de soumission

Le professeur M. Vazirgiannis est impliqué dans la recherche en science des données depuis les années 90. Il a travaillé dans différents domaines de cette science tout en maintenant un impact scientifique significatif. Il dirige le groupe Data Science and Mining de LIX / École Polytechnique, et a obtenu des fonds de recherche de partenaires industriels importants, prouvant ainsi le caractère innovant de ses recherches. Il a présenté des résultats au-delà de l'état de l’art dans le domaine de l'apprentissage automatique et de l'extraction de texte, notamment: i.Les représentations graphiques de texte (Graph-of-Words, prix du meilleur article à CIKM2013) ont été appliquées avec succès à une série de tâches du traitement du language naturel telles que l'extraction de mots clés, la synthèse, la détection d'événements. Certains de ces résultats sont utilisés dans des projets industriels (i.e LINTO). ii. Apprentissage automatique et apprentissage profond sur des graphes, notamment prix du meilleur article lors de la prestigieuse conférence IJCAI 2018 et une bibliothèque open source python pour les noyaux de graphes (Grakel).
En apprentissage profond, M. Vazirgiannis a mené des recherches actives qui ont abouti à des publications internationales sur les réseaux convolutifs pour les graphes et les représentations de noeuds structurels. M. Vazirgiannis a une activité significative dans l'enseignement, la supervision et l'organisation d'activités scientifiques à l'Ecole Polytechnique. Il a introduit pour la première fois les cours «Machine Learning», «Text Mining and NLP», très populaires parmi les étudiants. Il a supervisé plusieurs post-doctorants et 19 doctorats terminées. Ses collaborations à long terme incluent les universités Tsinghua et Columbia.

La chaire proposée aspirera à des sujets de recherche ambitieux liés aux applications et besoins industriels. Les graphes présentent une structure universelle pour la représentation de l'information, notamment les réseaux sociaux, le traitement du language, le biomédical et les neurosciences. Les représentations de graphes a en ce sens une importance majeure, car ils permettent de traiter des tâches d’apprentissage automatique pour lesquels la structure de graphe est une donnée centrale. L'objectif est donc de faire progresser l'état de l’art de ce domaine. Les principaux axes de recherche de la chaire sont dirigés par l'apprentissage profond pour les représentations de graphes. Ces nouvelles représentations contribueront également à la mise au point de méthodes avancées pour le traitement du language naturel pour la compréhension et la synthèse de la langue parlée, un problème en suspens en traitement du langage. Dans ce contexte, nous allons enrichir les ressources linguistiques de ces représentations contextuelles en collaboration avec nos partenaires industriels.

L’impact de la chaire pour l’Ecole Polytechnique / IPP sera multiple:
i. Influence scientifique via des publications dans des revues et conférences prestigieuses
ii. Collaborations internationales et impact avec des partenaires académiques prestigieux, notamment Tsinghua et Columbia University
iii. augmentation du capital de connaissances de l'Université via des projets industriels (les partenaires industriels étant impliqués dans la chaire) basés sur les mêmes thématiques, et potentiels brevets.
La chaire aura un impact significatif sur l’enseignement et la formation puisque les nouvelles méthodes seront ajoutées à des cours de master universitaires et exécutifs. En accord avec le programme national d'IA, la chaire contribue aux projets GT 1.1 (maintenir les talents en France, lancer de grandes infrastructures pour l'intelligence artificielle visant à la création de corpus de textes français), et GT 1.2. (développer un éco-système de formation pour l'IA en France, et encourager l'émergence du travail pour les documents juridiques).

Coordinateur du projet

Monsieur Michalis Vazirgiannis (Laboratoire d'Informatique de l'Ecole Polytechnique)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LIX Laboratoire d'Informatique de l'Ecole Polytechnique

Aide de l'ANR 599 400 euros
Début et durée du projet scientifique : août 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter