DS0504 - Enjeux de santé

Analyse Multivariée des Extrêmes et du RISQue Alimentaire – AMERISKA

AMERISKA

Analyse Multivariée des Extrêmes et du RISQue

Un réseau international de chercheurs étudiants les risques alimentaires et environnementaux

Le projet AMERISKA vise à encourager les interactions de personnes de milieux différents et de différents pays pour évaluer les risques de différents types. En particulier, le projet se concentre sur évaluation des risques dans les contextes de l'alimentation et de l'hydrologie qui sont deux problèmes majeurs de préoccupation pour la société. Pour évaluer les risques susmentionnés, une utilisation prudente des statistiques est nécessaire. Une difficulté majeure est que les événements extrêmes ne sont souvent pas bien modélisés en raison du manque d'observations. C'est un important défi pour les mathématiciens appliqués pour comprendre les phénomènes de queue lourds récemment observés. En particulier, il semble que l'importance des événements nécessite un point de vue global, impliquant De nombreux chercheurs forment différentes disciplines et observations météorologiques sur de nombreux sites.

L'une des tâches de ce projet est d'étendre d'abord les concepts précédents (regroupement, VaR, etc.) dans le cadre de processus multivariés. Les nouveaux modèles devraient présenter des clusters dans différentes directions. Nous voulons nous adapter ils de telle sorte que leur comportement extrême coïncide avec les directions de clustering «empiriques». La méthodologie sera adaptée au type de mesure de risque multivarié que nous envisagerons. Comme nous sommes intéressés dans les mesures de risque correspondant à des événements rares, il est important de garder à l'esprit certains objectifs de sparsité. Pour contourner la malédiction de la dimensionnalité, nous construisons des modèles parcimonieux de clusters. Les modèles multivariés AR (1) et GARCH (1,1) ainsi que certains modèles Markov et Processus ponctuels ont potentiellement les propriétés souhaitées. Les mesures de risque telles que les quantiles très élevés n'ont pas une extension multivariée simple et unique. Des mesures de risque adaptées aux données multivariées seront étudiées. Ils seront motivés par les applications. On peut penser à des ruines multivariées ou des VaR conditionnelles. Cependant, la modélisation et l'inférence du comportement de valeur extrême ne sont pas suffisantes pour obtenir des estimations des quantiles très élevées. Une extrapolation même au-delà de la portée des données est nécessaire. Pour ce faire, des techniques de simulation devraient être développées. Les méthodes classiques de Monte Carlo (MC) ne fournissent pas de résultats satisfaisants approximation de la VaR (ou de toutes mesures extrêmes). Soit les simulations MC fournissent des estimations insatisfaisantes, soit une quantité énorme de des simulations sont nécessaires pour obtenir des estimations raisonnables. Par conséquent, des techniques telles que l'échantillonnage d'importance ont été développés pour réduire le nombre de simulations.

L'ANR a permis de constituer un réseau de 52 chercheurs de 25 pays autour de la thématique de la théorie des valeurs extrêmes pour les données multivariées. L'accent a été mis sur le financement et la promotion des (très) jeunes chercheurs qui constituent une bonne proportion du réseau (20 membres). De part l'organisation de semestres thématiques, écoles d'été et sessions dans des conférences internationales, le réseau a diffuser une vision rigoureuse de l'analyse des valeurs extrêmes à un public large, mathématiciens mais aussi actuaires, analystes financiers, climatologues, hydrologues etc... Cette rencontre entre mathématiciens et praticiens s'est construit autour de l'étude de données statistiques avec l'organisation de différents challenges «New Challenges for New Data” à l'ISNPS et «Prediction of extremes quantiles« à EVA. Ce travail a débouché sur des recommandations, afin de respecter la rigueur mathématiques des outils statistiques, quant à la collecte des données et les scores (indices de risques) à utiliser. Il a aussi abouti à la publication de 12 articles dans des revues scientifiques de référence. L'analyse des valeurs extrêmes de données multivariées n'a pas validé l'hypothèse d'homogénéité des queues de distributions des modèles théoriques connus. De nouveaux modèles ont été développés afin d'incorporer ce phénomène nouveau. Les indices de risques usuels, aussi fondés sur l'homogénéité, semblent donc obsolètes. De nouveaux indices, fondés sur les variations régulières dites non standard, sont à l'étude. L'étude des clusters temporels a été bouleversé par l'étude de données hautes fréquences. Dans ce nouveau contexte, il n'est plus raisonnable de considérer les clusters séparés dans le temps. Le phénomène de superposition des clusters est modélisés par des processus Poisson clusters en temps continu. La discrétisation temporelles de tels processus fournit de nouveaux modèles de comptages d'une grande diversité.

Le développement récent de nouvelles captations de données modifie les approches théoriques à développer. Le réseau a entrepris des réflexions qui changent en profondeur l'analyse des valeurs extrêmes. Il faut poursuivre l'effort en consolidant le réseau afin de permettre une rapide adaptations aux enjeux provenant de l'analyse de ces nouvelles données. Le domaine où la révolution des données est la plus impressionnante, parmi les domaines traités par le réseau (alimentaire, environnementale, finance et assurance), est celui de l'environnement. A titre d'exemple, il est désormais possible de compter le nombre de gouttes de pluies tombant sur une grande surface. Nous avons décidé de recentrer le réseau sur les problèmes environnementaux (un autre example est la fonte des glaciers). Les défis sont énormes car les nouveaux types de données sont disponibles, en partenariat avec différents acteurs comme Météo France. Le réseau a pour ambition de devenir une référence de méthodologie de rigueur dans ce domaine. Le projet va lancer des thèses sur la théorie des valeurs extrêmes appliquées à ce nouveau type de données. En particulier, l'analyse fine de l'apparition de records de précipitations grâce à l'accumulation d'un très grand nombres de gouttes de pluie sur un site donné devra être analyser. Il est fondamental d'utiliser une approche stochastique fondée sur une théorie rigoureuse car le but ultime est l'extrapolation. Dans un contexte ou le changement climatique induit une succession de records sans précédent, il est urgent de modéliser ceux ci finement afin de quantifier les risques associés au futur record. Le but de ce projet ambitieux est de fournir des recommandations d'utilité publique comme par exemple les zones à risque pour les crues. Il devrait aussi permettre l'affinement des prédictions sur une grille très fine en temps et en espace.

12 papiers publiés ou soumis à des revues à comité de lecture.

AMERISKA : Analyse Multivariée des Extrêmes et du RISQue Alimentaire

Un réseau international de recherche sur l'évaluation quantitative des risques alimentaires et environnementaux.

Le but du projet AMERISKA est d'encourager des interactions scientifiques entre partenaires de différentes institutions françaises et étrangères autour de l'évaluation des risques. Le projet sera orienté plus particulièrement vers l'évaluation des risques dans le contexte de l'alimentation, de l'hydrologie et de la climatologie, trois enjeux de société majeurs.
• Evaluations des risques alimentaires : l'utilisation de produits chimiques et la dégradation de l'environnement naturel sont responsables de la présence de contaminants dans les aliments, généralement accumulés par le corps humain. Le degré de toxicité des produits et les conséquences pour la santé humaine nécessitent le développement de modèles stochastiques appropriés pour modéliser le processus d'accumulation.
• Evaluations des risques environnementaux : modéliser avec précision les structures spatio-temporelles des phénomènes atmosphériques extrêmes, comme les fortes pluies, est un défi pour les statisticiens du fait de la structure multidimensionnelle complexe des données. Les méthodes d'inférence, à la fois dans l'espace et le temps, seront au cœur des thématiques à développer pour les applications environnementales.

Une difficulté majeure est que les événements extrémaux sont souvent mal modélisés due à l'absence d'un grand nombre d'observations. A cet effet, modéliser la dépendance dans les phénomènes observés est un défi majeur pour les mathématiciens appliqués. Ces sujets nécessitent des compétences dans de nombreux domaines, ce qui implique la participation dans le réseau AMERISKA de chercheurs de disciplines différentes. En raison de l'émergence de grandes masses de données, il est désormais possible d'utiliser plus d'informations sur les événements extrêmes.

Un problème majeur est de traiter les phénomènes de dépendance des extrêmes dans un contexte multivarié. Quelques outils mathématiques appropriés ont été développés récemment, notamment la notion de processus à variations régulières multivariées. Ce nouveau concept probabiliste est adapté pour comprendre le comportement spatio-temporel des extrêmes. Toutefois, la littérature sur les modèles stochastiques des phénomènes extrémaux spatio-temporels est encore peu développée, en particulier pour les applications qui nous intéressent. Les premiers résultats statistiques dans le contexte de l'alimentation, de l'hydrologie et de la climatologie sont récents mais les applications convaincantes sont en devenir. Il est nécessaire de mettre en commun les compétences de plusieurs chercheurs pour faire face à ces défis. AMERISKA est un projet qui regroupe des mathématiciens appliqués préoccupés par les questions de risques extrêmes; ils collaboreront sur les problèmes mentionnés et proposeront des solutions adaptées aux contextes. L'un des objectifs du réseau est aussi d'organiser un semestre thématique sur les risques, qui pourrait être financé en partie par le Labex MME- DII .

La recherche sera coordonnée et dirigée par quatre partenaires : Olivier Wintenberger , Patrice Bertail , Philippe Naveau et Thomas Mikosch.
Ils coordonneront une équipe de 8 experts de différents pays, 12 professeurs français expérimentés, 9 jeunes chercheurs français et 2 étudiants en thèse travaillant tous dans le domaine de l'analyse quantitative des risques, d'un point de vue théorique ou appliqué.

Coordination du projet

Olivier Wintenberger (Laboratoire de Statistique Théorique et Appliquée)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Department of Mathematics University of Copenhagen
MODAL'X Modélisation Aléatoire de Paris X
LSTA Laboratoire de Statistique Théorique et Appliquée

Aide de l'ANR 49 920 euros
Début et durée du projet scientifique : septembre 2014 - 24 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter