ANR - JST CREST MIP - ANR - JST CREST Mathematical Information Platform 2021

Un nouveau principe de dualité Bayésienne pour l'apprentissage adaptatif, robuste et permanent en IA – BDAI

Résumé de soumission

Notre objectif est de développer de nouvelles méthodologies pour permettre un apprentissage adaptatif, robuste et continu des systèmes d'intelligence artificielle (IA). À l'heure actuelle, les méthodes d'apprentissage profond ne sont ni adaptatives ni robustes. Par exemple, il n'est pas facile d'ajouter de nouvelles connaissances aux modèles formés et, lorsqu'on y est contraint, les anciennes connaissances sont facilement oubliées. En présence de nouvelles données, le modèle entier doit être ré-entraîné à la fois sur les anciennes et nouvelles données, tandis qu'entraîner uniquement sur les nouvelles données conduit à l'oubli catastrophique du passé. Toutes les données doivent être disponibles en même temps, et cette nécessité de grands ensembles de données pèse sur presque tous les systèmes d'apprentissage profond. Notre principal objectif est de remédier à ce problème en développant de nouveaux paradigmes d'apprentissage pour soutenir des systèmes adaptatifs et robustes qui apprennent tout au long de leur vie.

Nous introduisons un nouveau principe pour l'apprentissage automatique, le principe de la dualité bayésienne ou "Bayes-Dualité". Dans le passé, en utilisant les principes bayésiens, nous avons montré qu'une majorité d'algorithmes d'apprentissage automatique peuvent être considérés comme des méthodes de gradient naturel. Notre nouvelle découverte est que les gradients naturels permettent une "représentation double" qui relie les modèles à leurs données d'apprentissage. Cela peut être utilisé pour concevoir de nouveaux systèmes d'apprentissage adaptatifs et permanents en comprenant les connaissances actuelles extraites par un modèle, en adaptant les connaissances à de nouvelles situations et en collectant de nouvelles données pour compléter les connaissances actuelles. Nous prévoyons de développer pleinement la théorie de la dualité de Bayes et de l'appliquer pour obtenir de nouvelles méthodes pratiques d'apprentissage adaptatif, robuste et permanent pour les réseaux profonds.

Notre proposition conduira à de nombreuses percées dans le domaine de l'IA. Nous avons réparti notre travail sur dix projets. Les trois premiers se concentrent sur les aspects théoriques tandis que les sept derniers se concentrent sur le développement de méthodes pratiques :

(1) Nouvelle théorie de la dualité pour l'apprentissage automatique.
(2) Généralisation de la dualité convexe aux problèmes non convexes.
(3) Nouvelles garanties théoriques sur l'erreur de généralisation des systèmes adaptatifs.
(4) Représentation des connaissances dans l'apprentissage profond.
(5) Estimation de l'incertitude pour un apprentissage profond robuste.
(6) Adaptation rapide des architectures de réseaux de neurones.
(7) Transfert rapide des connaissances.
(8) Apprentissage profond distribué et évolutif.
(9) Collecte rapide de connaissances en apprentissage profond.
(10) Méthodes d'apprentissage profond par renforcement.

Le projet 1 se concentrera sur la théorie générale de la dualité de Bayes pour l'apprentissage automatique et sa relation avec les autres types de dualités en mathématiques. Le projet 2 se concentrera spécifiquement sur la dualité convexe. Le projet 3 développera de nouvelles garanties théoriques des systèmes adaptatifs. Les projets 4 et 5 se concentrent sur la robustesse, tandis que les projets 6 à 7 se concentrent sur l'adaptation. Le projet 8 utilisera des idées similaires pour la formation distribuée évolutive en partageant uniquement les représentations doubles entre différents nœuds de calcul. Les projets 9 à 10 se concentreront sur la collecte de nouvelles connaissances : le projet 9 développera de nouvelles méthodes d'apprentissage actif pour collecter et conserver des ensembles de données. Enfin, le projet 10 utilisera cette idée pour apprendre aux modèles à utiliser les connaissances passées lorsqu'ils sont confrontés à de nouvelles situations.

Julyan Arbel (Centre de Recherche Inria Grenoble - Rhône-Alpes)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

RIKEN RIKEN Center for Advanced intelligence project, Approximate Bayesian Inference Team
INRIA GRA Centre de Recherche Inria Grenoble - Rhône-Alpes

Aide de l'ANR 463 903 euros
Début et durée du projet scientifique : mars 2022 - 60 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.