Approche IA pour un Liage de Données CEntré sur les Données – DACE-DL
Avec la science ouverte et les principes FAIR, les données liées ont gagné en popularité pour l'échange, la fédération et le partage de (méta)données sur le Web. Le liage de données est le défi scientifique d'établir automatiquement des liens entre les entités de jeux de données structurés. Des systèmes complexes de liage existent – évalués sur des benchmarks publics – et ont permis la génération de grandes quantités de données liées. Cependant, ils offrent des solutions génériques dont l’applicabilité est limitée quand les données sont très hétérogènes et spécifiques. DACE-DL cible un changement de paradigme avec une méthodologie centrée sur les données se reposant sur l'apprentissage automatique. Repartant de résultats précédents (en musique, encyclopédie, agronomie, biodiversité), nous étudierons ce qu'une approche hybride basée sur l'IA peut apprendre des données liées déjà disponibles et des systèmes de liage de données existants modulaires afin de réinjecter ces connaissances dans les défis actuels des données Web, par exemple dans le contexte du COVID-19 ou dans le domaine de l'agronomie.
Coordination du projet
Konstantin Todorov (Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
INRAE MISTEA
IRIT Institut de Recherche en Informatique de Toulouse
LIRMM Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier
Aide de l'ANR 410 032 euros
Début et durée du projet scientifique :
January 2022
- 42 Mois