Projets financés
LLM à jour pour tous – LLM4all
Lorsqu'ils sont de taille suffisante, les grands modèles de langage (LLM) exhibent des capacités émergentes remarquables: apprendre en contexte, décomposer un problème en parties, etc. Ces capacités émergentes, ainsi que les performances obtenues sur de nombreuses tâches, tendent à prouver que la ta
Modèles de fondation intégrés pour les Bibliothèque, Archives et Musées – FINLAM
La transformation numérique des bibliothèques qui repose depuis plus de 20 ans sur la technologie des OCR (Optical Character Recognition), fait face à certaines limitations tant en termes de qualité, du fait de la diversité des collections et des limitations de la technologie OCR, qu’en termes de va
Traduire avec les Large Language Models – TRaLaLaM
En l’espace de six courtes années (2017-2023), le domaine du traitement des langues (TAL) a été profondément transformé par les avancées des architectures neuronales génériques, qui sont à la fois utilisées pour apprendre des représentations profondes pour les unités linguistiques et pour générer du
Grands modèles de langue adaptables et souverains pour le domaine médical français – MALADES
L'arrivée récente des Grands Modèles de Langue (Large Language Models ou LLMs) et de leurs outils associés pour le grand public laissent apparaître des enjeux majeurs pour la société. Parmi les nombreux domaines qui sont, ou vont être, impactés par ces modèles génératifs, le domaine biomédical est u
Evaluation intrinsèque et extrinsèque des biais dans les grands modèles de langue – InExtenso
Les giga modèles de langue sont le couteau suisse du traitement automatique des langues (TAL) actuel. Ils surpassent souvent l’état de l’art pour des tâches telles que l’étiquetage en parties du discours, la classification des textes et la reconnaissance des entités nommées, ouvrant ainsi la voie à
Assistants Digitaux pour l'Accès Généralisé à l'Information – GUIDANCE
Ce projet s’inscrit dans le contexte des grands modèles de langage (LLMs) et des systèmes conversationnels (par exemple ChatGPT, WebGPT), qui ont connu un essor considérable au cours des dernières années. Le projet GUIDANCE vise à mener des recherches sur l’accès à l’information numérique assist
Generalized Earth Observation with Remote Sensing and Text – GEO ReSeT
Ce projet vise à développer un modèle fondation polyvalent pour les données géospatiales qui peut être utilisé pour un grand nombre de tâches et avec une variété de modalités de données. En utilisant la localisation sur la surface de la Terre comme lien commun entre les différentes modalités, le mod
Construction et d'évaluation de grands modèles de langue multimodaux et inclusifs (écrit, oral, pictogrammes) pour le français général et clinique – Pantagruel
Le projet Pantagruel est une initiative ambitieuse qui vise à développer et à évaluer des modèles linguistiques multimodaux (écrit, oral, pictogrammes) et inclusifs pour le français. Le projet s'appuie sur l'expertise de chercheurs de différentes disciplines, notamment l'informatique, le traitement