TSIA - Learning - Thématiques Spécifiques en Intelligence Artificielle (Machine Learning Operations, Génie Logiciel pour l’Intelligence Artificielle) 2024

BenchArk - Une suite d'évaluation numérique efficace et robuste pour l'intelligence artificielle – BenchArk

Résumé de soumission

Les comparaisons numériques sont un pilier de la démarche scientifique dans le domaine de l'apprentissage automatique.
En raison de nombreux obstacles pratiques et statistiques, la reproductibilité des résultats publiés est cependant souvent insuffisante : de nombreux détails peuvent invalider les comparaisons numériques, qu'il s'agisse d'une méthodologie inappropriée ou d'une quantification insuffisante des incertitudes.
En 2022, nous avons publié benchopt, un package Python open source doublé d'un cadre pour exécuter, réutiliser, partager et publier de manière transparente des benchmarks en optimisation numérique.
Dans ce projet, nous visons à étendre Benchopt à l'ensemble de la communauté machine learning, pour en faire un nouveau standard qui fournisse aux chercheurs et aux praticiens des méthodes de benchmarking efficaces et valides.
Notre objectif est de fédérer la communauté de l'apprentissage automatique pour développer des benchmarks informatifs et statistiquement valides, tout en fournissant des outils pour réduire les freins identifiés dans la mise en œuvre de ces pratiques.
Les résultats du projet seront intégrés dans la bibliothèque open source Benchopt.

Coordination du projet

Thomas MOREAU (Centre Inria de Saclay)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

Inria Saclay - MIND/SODA Centre Inria de Saclay
IMAG Institut Montpelliérain Alexander Grothendieck
OCKHAM Optimisation, Connaissances pHysiques, Algorithmes et Modèles

Aide de l'ANR 588 611 euros
Début et durée du projet scientifique : septembre 2024 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter