ANR-FWF - Appel à projets générique 2018 - FWF

Planification d'expériences incrémentales – INDEX

Systèmes dynamiques, maximisation de fonctions sous-modulaires, méthodes à noyau et minimisation de discrépances à noyau par «kernel herding« (gradient conditionnel).

* Un nouveau critère de planification, symétrique, pour la discrimination entre modèles, reposant sur la linéarisation des réponses des modèles et la définition d'ensembles nominaux pour leurs paramètres.
* Un algorithme glouton accéléré pour la minimisation de l'entropie mutuelle.
* De nouvelles méthodes pour l'estimation adaptative d'un percentile dans un modèle de type processus gaussien.
* La construction gloutonne d'un modèle de remplissage d'espace en grande dimension utilisant des plans factoriels fractionnaires pour réduire la taille de l'ensemble candidat.
* Des inégalités pour l'élimination des points inessentiels dans les plans c- et A-optimaux (construction de «0-core sets«).
* Un algorithme pour filtrage en ligne d'une séquence de points expérimentaux.
* L'étude des liens entre l'intégration bayésienne, la minimisation d'une énergie (à noyau), d'une discrépance à noyau («maximum-mean-discrepancy«), la théorie du potentiel et les plans à remplissage d'espace («space filling«).
* L'approximation de noyaux singuliers par le biais de fonctions complètement monotones bornées.
* La construction de modèles de validation et test.
* La construction de plans en blocs optimaux pour l'estimation dans les modèles de copules.

Le projet évolue selon le calendrier prévu, bien que la crise du corona ait provoqué un certain retard.
Un nouveau sujet, qui a émergé lors d'une réunion de projet en février 2020, concerne la construction des plans de validation. En bref, le problème est de proposer un ensemble de m points expérimentaux où évaluer une fonction f, afin de vérifier l'exactitude d'un modèle de f construit à partir d'évaluations sur un plan distinct à n points. Des études préliminaires ont été entreprises à EDF et plusieurs documents sont en préparation.

Cinq articles publiés dans des revues internationales (Biometrical J., J. of Statistical Planning and Inference, SIAM/ASA J. Uncertainty Quantification, J. of Computational and Applied Mathematics, Appl. Stochastic Models Bus. Ind.), quatre soumis (plus des communications et des soumissions à plusieurs conférences).

Résumé de soumission

Le projet INDEX concerne la construction efficace de solutions incrémentales pour des problèmes de planification d’expériences de simulation.


L’industrie utilise de plus en plus fréquemment des outils de simulation d’un coût numérique extrêmement élevé. L’utilisation directe de ces codes pour diverses tâches d’ingénierie, comme l’optimisation de la conception ou l’évaluation de performance, qui requièrent une exploration intensive du domaine de variation des variables d’entrée du code, demanderait alors un temps de calcul prohibitif. On doit par conséquent remplacer ce code numérique par un modèle de moindre complexité, souvent un interpolateur semi-paramétrique d’un ensemble fini de réponses (sorties) du simulateur. La qualité du modèle approché dépend du jeu de variables d’entrées utilisé pour sa construction (le plan d’expériences), et elle croît avec la taille N de ce plan.


Les approches classiques de planification d’expériences considèrent N fixé et essaient de maximiser l’information fournie par cet ensemble de N points. Cependant, dans de nombreuses applications les simulations sont intégrées progressivement, et la décision d’arrêter l’apprentissage est prise en ligne, soit à partir de la qualité estimée du modèle de substitution déjà construit, soit, de façon plus pragmatique, parce que le budget (en coût ou en temps de calcul) est déjà consommé. Dans un tel contexte, il est important que l’ordre d’exécution des points d’expérimentation soit bien choisi, de manière à ce que le plan soit déjà aussi informatif que possible pour tout n<N. Cette dernière formulation du problème est au coeur du projet INDEX.<br />

En réalité, les données d’apprentissage, obtenues en faisant tourner le code de simulation aux points d’expérience, sont utilisées à la fois pour l’identification du modèle de substitution et pour prédire la réponse du code à d’autres entrées (par interpolation à partir du modèle). Ces deux objectifs correspondent à des critères de planification bien distincts : alors qu’il s’agit pour le premier de choisir au mieux une famille de modèles et d’estimer ses paramètres avec précision (en particulier, la cohérence spatiale du champ des sorties), le second conduit à préférer des plans d’expériences qui remplissent au mieux (uniformément) l’espace des entrées. Une façon d’aborder ce problème multicritères est de reformuler la planification d’expériences comme un problème d’optimisation sous contrainte, en recherchant le plan le plus informatif sous une contrainte de répartition géométrique de ses points. L’objectif d’INDEX est de proposer des méthodes de construction incrémentale de tels plans contraints.


De nombreuses variantes de ce problème de sélection d’un sous-ensemble de points sont NP difficiles, et l’objectif de construction d’une solution optimale doit donc être revu à la baisse, pour se contenter d’une bonne solution approchée. Des algorithmes avec garantie d’approximation – au sens où la valeur du critère pour la solution fournie vaut au moins une fraction donnée de la valeur optimale – ont été proposés dans la communauté d’informatique/RO pour beaucoup de problèmes similaires, et le consortium d’INDEX, qui réunit des experts en informatique comme en planification d’expériences, pourra s’appuyer sur ces résultats. Nous pensons que des algorithmes plus efficaces ainsi que de meilleures bornes d’efficacité pourront être obtenus en prenant en compte la spécificité du problème de planification, notamment en étudiant les propriétés ergodiques des systèmes dynamiques discrets associés à ces algorithmes.


Au-delà de son intérêt scientifique fondamental, le programme de recherche d’INDEX aura aussi des retombés pratiques : le besoin en plans d’expériences emboités amené dans le consortium par EDF est motivé par l’exploitation de modèles de substitution dans un vrai contexte industriel.

Coordinateur du projet

Monsieur Luc Pronzato (Laboratoire I3S, CNRS UCA)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

EDF SA EDF R&D SITE CHATOU
JKU Johannes Kepler Universität Linz
CNRS Laboratoire I3S, CNRS UCA

Aide de l'ANR 249 413 euros
Début et durée du projet scientifique : janvier 2019 - 36 Mois

Liens utiles

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter