Compilation de langages intermédiaires en exécutables efficaces pour le big data – CLEAR
Ce projet s'attaque à un défi fondamental de notre époque: la construction de modèles de programmation et de techniques de compilation pour l'exploitation correcte et efficace de très gros volumes de données. Nous proposons de rechercher des spécifications de haut niveau pour la construction de pipelines de transformation et d'extraction produisant des connaissances précieuses à partir de données riches et hétérogènes. Nous allons étudier comment synthétiser du code qui est correct et optimisé pour être exécuté sur des infrastructures pour le big data. Le projet comprend un axe méthodologique et un axe appliqué. Le premier axe propose de rechercher un langage intermédiaire supportant les modèles hétérogènes de données (arbres, graphes, tuples clé-valeur, tableaux, flux) et équipé de techniques de compilation intelligentes, c'est-à-dire à base de raisonnement logique. Le développement des analyses statiques et des techniques de compilation basées sur des modèles de coûts avancés et sur du raisonnement logique à l'aide de logiques décidables très expressives constitue une originalité et un facteur de succès du projet. Le deuxième axe, appliqué, vise à valider nos résultats expérimentalement avec des applications concrètes dans le contexte des villes intelligentes, de la finance et de la grande distribution.
Coordination du projet
Pierre Geneves (Centre de recherche Inria Grenoble Rhône-Alpes - TYREX)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Inria - Grenoble Rhône-Alpes Centre de recherche Inria Grenoble Rhône-Alpes - TYREX
Aide de l'ANR 302 819 euros
Début et durée du projet scientifique :
décembre 2016
- 48 Mois