Repenser l'essence, la flexibilité et la réutilisabilité de l'exploitation de modèles avancés – REFRAME
La réutilisation de la connaissance apprise est d'importance critique dans la majorité des domaines d'application à base de connaissances, particulièrement parce que l'on peut s'attendre à ce que le contexte d'opération change entre l'entraînement et le déploiement. En apprentissage artificiel, cela a été le plus fréquemment étudié dans le cas de variation de la répartition des classes ou du coût pour la classification supervisée. Tandis que cela est évidemment utile dans beaucoup de situations pratiques, il y a un besoin clair et pressant de généraliser la notion de contexte d'opération au delà du cadre étroit de la classification tenant compte du coût. Ce projet s'attaque au défi de revoir le processus complet des données aux connaissances afin de prendre en compte une notion de contexte d'opération siginificativement généralisée.
Nous développerons une approche innovante et méthodique de la réutilisation de connaissances qui permettra à un panel de techniques connues de fouille de données et d'apprentissage artificiel de gérer des changements de contextes communs, incluant : (i) des changement de représentation des données ; (ii) la disponibilité de nouvelles connaissances du domaine ; (iii) des prédictions requises à différents niveaux d'agrégation ; et (iv) l'application de modèles à des distributions ou populations différentes. L'approche est fondée sur la notion nouvelle de recadrage, qui peut s'appliquer aux attributs d'entrée, aux prédictions en sortie, ou à des parties des modèles (par exemple, des motifs), par là même généralisant, intégrant et élargissant les notions diverses et plus traditionnelles d'ajustement du modèle en apprentissage artificiel et fouille de données.
Le but ultime de ce projet est de fournir une bien meilleure compréhension des problèmes impliqués par la génération et le déploiement d'un modèle dans différents contextes, autant que le développement d'outils qui facilitent l'extraction, la réutilisation, l'échange et l'adaptation de connaissances pour un large spectre de contextes d'opération. Ce projet s'intéressera à trois domaines d'application complexes : des applications géographiques avec des données spatio-temporelles, l'utilisation intelligente d'énergie (production et consommation de ressources), et la génomique humaine (analyse de la relation phénotype-génotype). Ces trois domaines d'application exigeants serviront de support concret au projet en apportant de nouveaux problèmes et en nous permettant de valider expérimentalement nos méthodologies, outils et algorithmes.
Coordination du projet
Peter FLACH (University of Bristol) – ERA-Net_Peter.Flach@bristol.ac.uk
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenaire
UoB University of Bristol
TUV Technical University of Valencia
LSIIT Laboratoire des sciences de l'image de l'informatique et de la télédétection
Aide de l'ANR 289 417 euros
Début et durée du projet scientifique :
septembre 2012
- 42 Mois