CE39 - Sécurité Globale et Cybersécurité

Réseaux Sociaux en situation de Catastrophe naturelle : Interprétation Opérationnelle – ReSoCIO

Réseaux Sociaux en situation de Catastrophe naturelle : Interprétation Opérationnelle

Proposer une démarche outillée permettant de démontrer l’intérêt et la faisabilité de l’exploitation automatisée des données issues de Twitter en contexte de crise liée à une catastrophe naturelle, en se focalisant sur le cas des crues éclair et des séismes.<br /><br />Particulièrement adaptée aux phénomènes à cinétique rapide qui prennent de court les autorités, cette voie de recherche constitue un moyen d’éclairer les gestionnaires de crise avec des informations consolidées.

Outiller les gestionnaires de crise pour l'analyse automatique des réseaux sociaux en cas de survenue de catastrophes naturelles

Les deux-tiers des communes françaises sont aujourd’hui considérées comme exposées aux catastrophes naturelles. Le risque inondation est le plus fréquent, tandis que le risque sismique figure parmi les plus redoutés en termes de nombre de victimes potentielles. Cette situation est appelée à s’accentuer dans les prochaines décennies, du fait de la combinaison d’une augmentation de fréquence et d’intensité de certains aléas due aux changements climatiques, avec des dynamiques démographiques qui tendent à concentrer les populations dans les zones à risque, notamment le long du littoral. De ce fait, et avec d’importantes hétérogénéités territoriales, les autorités doivent composer avec la diversité des aléas pour établir des dispositifs de gestion de crise efficients à même de protéger les personnes et les biens. Cela requiert la construction d’une connaissance situationnelle permettant de mieux cibler et anticiper les prises de décisions, et nécessite la multiplication des canaux de remontée d’informations depuis le terrain.<br /><br />Dans ce contexte, RéSoCIO ambitionne de proposer une démarche outillée permettant de démontrer l’intérêt et la faisabilité de l’exploitation automatisée des données issues du réseau social Twitter en contexte de crise liée à une catastrophe naturelle à cinétique rapide, en se focalisant sur le cas des crues éclair et des séismes.<br />Cet objectif général s’accompagne de la levée de verrous spécifiques, dont le 1er concerne la capacité, dans un contexte de catastrophe naturelle, à fournir des informations rapidement. La levée de ce verrou est d’autant plus délicate que l’enjeu sociétal majeur que constitue une réponse plus ciblée et rapide face aux catastrophes naturelles requiert que les tweets soient analysés avec d’autres types de données exogènes rapidement disponibles (sorties de modèles météo, caractéristiques des séismes, etc.), et que le processus d’analyse soit automatisé pour permettre un traitement continu “à la volée”.<br />Un autre verrou à lever relève de l’acceptabilité de ce type de contribution et de son exploitabilité potentielle en contexte réel. Il découle du caractère incertain de l’adoption d’outils innovants - du fait de difficultés d’usage et du contexte culturel pouvant entraîner jusqu’à leur abandon -, qui ne peut être réduit que par une prise en compte du contexte organisationnel. Sur cette base, RéSoCIO propose une analyse transverse de la façon dont les données issues de Twitter peuvent être exploitées par les acteurs intervenant dans la gestion opérationnelle des catastrophes naturelles, avec comme principal caractère novateur l’identification couplée de mécanismes algorithmiques et organisationnels.

Du fait de l’ampleur des verrous scientifiques adressés, le projet se concentre sur deux types d’aléas naturels étudiés à partir des données du seul réseau social Twitter, choisi pour sa simplicité d'accès à des données diffusées largement publiquement : 1. les crues-éclair qui représentent un risque majeur difficile à anticiper et dont la fréquence est en augmentation, notamment dans le sud de la France, et 2. les séismes qui constituent un risque majeur imprévisible et potentiellement très destructeur menaçant une partie importante du territoire national. Couverts par les expertises thématiques reconnues du BRGM et de PREDICT-Services, ces aléas relèvent de processus très différents donnant lieu à des situations de crises aux emprises géographiques et aux caractéristiques variées.

S’agissant de l’outillage développé dans le cadre du projet, il est proposé de mettre en place des webservices interopérables, moyens efficaces et flexibles pour permettre la communication entre plateformes, et qui ne nécessitent pas de développement lourd d’interface utilisateurs. Enfin, pour faciliter l’analyse des dynamiques organisationnelles du réseau d’acteurs de la gestion de crise, le projet concentrera ses analyses sur le territoire pilote du Sud-Est de la France, en se focalisant sur plusieurs cas d’usage : les analystes de PREDICT-Services, des Services d’Incendie et de Secours (SIS), des cellules de crises communales, ...

Sur la base de ces cas d’usage, le projet rassemble une équipe pluridisciplinaire afin de répondre aux objectifs visés. Le programme de travail et les activités de recherche associées sont organisés en six lots de travail (LT) :
- LT0 : Coordination et dissémination,
- LT1 : Elaboration des événements de référence
- LT2 : Collecte, analyse et extraction d’informations
- LT3 : Mise en sens contextuelle
- LT4 : Aide à la décision
- LT5 : Analyse organisationnelle des usages

Dans un paysage de recherche aux plateformes pléthoriques et souvent non-pérennes, la grande spécificité du projet ReSoCIO est de reposer sur 3 plateformes existantes, robustes et complémentaires, permettant une montée en abstraction depuis l’échelle de la donnée brute (SURICATE-Nat), à celle de l’information (RIOSUITE) et jusqu’à celle du renseignement utile à la prise de décision (WikiPREDICT).

LT1. Deux applications ont été développées, l’une pour la récupération, le stockage et la diffusion de collections de tweets entre partenaires, et l’autre pour permettre la labellisation manuelle de tweets. Parmi les crues éclairs et séismes survenus en France ces dernières années, 22 événements ont été jugés d’intérêt pour le projet, auxquels 3 séismes internationaux ont été ajoutés. Les événements les plus notables ont donné lieu à la rédaction d’une fiche de synthèse décrivant le développement du phénomène, ses effets, les actions de gestion de crise menées.

LT2. Intégration en cours d’une 1ère version d’un modèle d’extraction et de désambigüisation des toponymes dans la plateforme SURICATE-Nat. Il s’agit d’un modèle d’apprentissage profond qui s’appuie sur un jeu de données construit spécifiquement pour favoriser l’extraction de l’information géographique dans des tweets en français. Un modèle d’apprentissage multilingue permettant d’identifier les tweets relatifs à une crise a également été développé et sera implémenté dans SURICATE-Nat. Enfin, un travail d’annotation de tweets est en cours pour entrainer de nouveaux algorithmes prédictifs.

LT3. Développement d’un algorithme de détection des inondations à partir des variations des fréquences d’émission des tweets. La 1ère version d’un algorithme semi-supervisé d’extraction d’information a été produite, afin de relever les mots d’intérêts dans les tweets. Des règles logiques simples permettent d’instancier des liens sémantiques entre les mots extraits dans les mêmes tweets afin de générer des modèles situationnels contextualisés. Ces règles vont prochainement être enrichies sur des conditions spatio-temporelles.

LT4. Un travail d’identification des liens à établir entre les plateformes des partenaires a été réalisé : il va guider la création de webservices. Par ailleurs, à l’occasion du comité de pilotage de 2022, des représentants de services de secours ont pu présenter aux partenaires leurs retours d’expériences quant à l’usage des médias sociaux en appui au situation d’urgence. Un atelier a également été organisé afin d’identifier les besoins en la matière d’un certain nombre de praticiens de la gestion de crise.

LT5. Une analyse exploratoire du contexte inter-organisationnel a été menée avec des entretiens qui ont permis de mettre en évidence les besoins informationnels des praticiens ainsi que de mieux comprendre leur appréhension des réseaux sociaux. Une analyse de cas a débuté pour explorer les crues éclairs des vallées de la Roya et de la Vésubie en octobre 2020. Les données qualitatives ont été collectées via le LT1 (RETEX, rapport de commission) ainsi que par des entretiens avec des experts.

Des webservices délivrant en temps-réel le résultat de l’analyse de tweets sont actuellement en cours de développement. Ces webservices seront dès 2023 intégrés dans l’hyperviseur de crise de PREDICT-Services, de sorte à pouvoir être testés dans un contexte opérationnel.

Grace à ce dispositif, le projet ReSoCIO va rentrer dans une phase d’implication accrue des praticiens de la gestion de crise, avec notamment la mise en place d’un design expérimental à partir du printemps 2023, permettant d’évaluer l’apport de l’outil au sein des organisations.

Adrot A. et al. (2022, May). Using Social Media Data in Emergency Management: a proposal for a socio-technical framework and a systematic literature review. In ISCRAM 22.
Adrot, A., Aguerre, M., Data Ecosystems and Disaster Risk Reduction in Cross-border Regions: Visioning from 2020 Roya Valley Flood Disaster. ISCRAM, 2022, Tarbes (France)
Auclair, S. (2020, November). Prospects for better disaster management using AI. Human-centric AI – 2nd French-German-Japanese Symposium, “AI & Environment: Risk prevention” Session
Caillaut, G., Gracianne, C., Abadie, N., Touya, G., & Auclair, S. (2022, May). Automated construction of a French Entity Linking dataset to geolocate social network posts in the context of natural disasters. In ISCRAM 22. hal.archives-ouvertes.fr/hal-03631387/
Caillaut, G., Gracianne, C., Auclair, S., Abadie, N., & Touya, G. (2022, June). Annotation sémantique pour la géolocalisation d'entités spatiales dans des tweets. In PFIA Résilience et IA. hal.archives-ouvertes.fr/hal-03682484/

Les deux-tiers des communes françaises sont aujourd’hui considérées comme exposées aux catastrophes naturelles. Le risque inondation est le plus fréquent, tandis que le risque sismique figure parmi les plus redoutés en termes de nombre de victimes potentielles. Cette situation est appelée à s’accentuer dans les prochaines décennies, du fait de la combinaison d’une augmentation de fréquence et d’intensité de certains aléas due aux changements climatiques, avec des dynamiques démographiques qui tendent à concentrer les populations dans les zones à risque, notamment le long du littoral. De ce fait, et avec d’importantes hétérogénéités territoriales, les autorités doivent composer avec la diversité des aléas pour établir des dispositifs de gestion de crise efficients à même de protéger les personnes et les biens. Cela requiert la construction d’une connaissance situationnelle permettant de mieux cibler et anticiper les prises de décisions, et nécessite la multiplication des canaux de remontée d’informations depuis le terrain. Dans ce contexte, RéSoCIO ambitionne de proposer une démarche outillée permettant de démontrer l’intérêt et la faisabilité de l’exploitation automatisée des données issues du réseau social Twitter en contexte de crise liée à une catastrophe naturelle à cinétique rapide, en se focalisant sur le cas des crues éclair et des séismes. Cet objectif général s’accompagne de la levée de verrous spécifiques, dont le 1er concerne la capacité, dans un contexte de CATNAT, à fournir des informations rapidement. La levée de ce verrou est d’autant plus délicate que l’enjeu sociétal majeur que constitue une réponse plus ciblée et rapide face aux catastrophes naturelles requiert que les tweets soient analysés avec d’autres types de données exogènes rapidement disponibles (sorties de modèles météo, caractéristiques des séismes, etc.), et que le processus d’analyse soit automatisé pour permettre un traitement continu “à la volée”. Un autre verrou à lever relève de l’acceptabilité de ce type de contribution et de son exploitabilité potentielle en contexte réel. Il découle du caractère incertain de l’adoption d’outils innovants - du fait de difficultés d’usage et du contexte culturel pouvant entraîner jusqu’à leur abandon -, qui ne peut être réduit que par une prise en compte du contexte organisationnel. Sur cette base, RéSoCIO propose une analyse transverse de la façon dont les données issues de Twitter peuvent être exploitées par les acteurs intervenant dans la gestion opérationnelle des catastrophes naturelles, avec comme principal caractère novateur l’identification couplée de mécanismes algorithmiques et organisationnels. Le travail proposé se décline en différentes étapes : captation, analyse, puis fusion des tweets avec d’autres données et connaissances. Dans un paysage de recherche aux plateformes pléthoriques et souvent non-pérennes, la grande spécificité ainsi que le point différenciant du projet est de reposer sur 3 plateformes existantes, robustes et complémentaires, permettant une montée en abstraction depuis l’échelle de la donnée brute (SURICATE-Nat), à celle de l’information (RIOSUITE) et jusqu’à celle du renseignement utile à la prise de décision (WikiPREDICT). Le développement de ces 3 plateformes atteste à lui seul de manière démonstrative de la prise en compte, et de la contribution à l’état de l’art : elles deviendront les réceptacles naturels des méthodologies d’analyse développées dans le projet.

Coordination du projet

Samuel Auclair (BUREAU DE RECHERCHE GEOLOGIQUE ET MINIERE)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

PREDICT SERVICES SAS
DRM Dauphine Recherches en Management
BRGM BUREAU DE RECHERCHE GEOLOGIQUE ET MINIERE
ARMINES

Aide de l'ANR 473 137 euros
Début et durée du projet scientifique : - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter