Assistants Digitaux pour l'Accès Généralisé à l'Information – GUIDANCE
Assistants Digitaux pour l'Accès Généralisé à l'Information
Le projet GUIDANCE vise à mener des recherches sur l’accès à l’information numérique assisté par le dialogue. En particulier, le projet a pour but de surmonter plusieurs limitations des LLMs actuels ainsi que de développer de nouvelles architectures et jeux de données adaptés à cette tâche.
Les quatres défis de GUIDANCE
* Comment concevoir de nouveaux LLMs ou réutiliser des LLMs pour l'accès à l'information guidée par le dialogue (DbIA) ;<br />* Comment exploiter les techniques d’apprentissage automatique enrichies par la recherche d’information (ReML) afin d’améliorer la précision et l’efficacité des systèmes de recherche d’information ;<br />* Adapter les LLMs et développer de nouvelles architectures (pour les modèles de DbIA) afin de gérer les situations de faibles ressources et l’adaptation aux domaines — avec une attention particulière portée aux langues à faibles/moyennes ressources (par ex. l’occitan, le français) ;<br />* Concevoir des modèles de DbIA capables de garantir la véracité et l’explicabilité des informations retrouvées et synthétisées, tout en préservant la subjectivité de l’utilisateur.
Ce projet s’inscrit dans le contexte des grands modèles de langage
(LLMs) et des systèmes conversationnels (par exemple ChatGPT, WebGPT),
qui ont connu un essor considérable au cours des dernières années. Le
projet GUIDANCE vise à mener des recherches sur l’accès à l’information
numérique assisté par le dialogue. En particulier, le projet porte sur
la manière de permettre aux utilisateurs d’accéder à l’information
numérique, dans le but de surmonter plusieurs limitations des LLMs
actuels :
1. Les LLMs n’ont pas été conçus pour l’accès à l’information, que ce
soit au niveau des tâches de préformation ou de la mise au point de
l’information. que ce soit au niveau des tâches de pré-entraînement
ou des tâches de mise au point.
2. Les LLMs ont des capacités de généralisation limitées à de nouveaux
domaines et/ou langues ;
3. La véracité et la sincérité des résultats sont discutables.
4. Les modèles de LLMs les plus performants ne sont pas libres d’accès
et la méthodologie scientifique ainsi que l’évaluation appropriée
sont à peine décrites dans le document. la méthodologie scientifique
et l’évaluation appropriée sont à peine décrites dans la dans la
littérature scientifique.
Du point de vue de la construction d’une communauté, le projet GUIDANCE
vise à fédérer le réseau français de recherche d’information, en
réunissant des experts du domaine pour faire avancer le développement de
modèles d’accès à l’information basés sur le dialogue (DbIA) en
s’appuyant sur les LLMs. GUIDANCE est soutenu par des partenaires
appartenant à l’association ARIA et rassemble 18 chercheurs de 6 groupes
liés à la RI et au TAL au sein de 4 laboratoires de recherche. Les
partenaires s’engagent en outre à produire des ressources annotées en
libre accès, tant au niveau national qu’international. Ces ressources
seront utilisées pour évaluer et développer des modèles pour DbIA, et
constitueront une ressource précieuse pour la mise en place de systèmes
DbIA en libre accès.
Du point de vue de la recherche, GUIDANCE aborde quatre défis associés à
ce projet :
1. Comment concevoir de nouveaux LLM ou réutiliser des LLM pour DbIA ;
2. Comment tirer parti de l’utilisation de LLM pour DbIA ;
3. Comment tirer parti des techniques d’apprentissage automatique
améliorées par la recherche (ReML) pour améliorer la précision et
l’efficacité des systèmes de recherche d’informations ;
4. Développer de nouvelles architectures (pour les modèles DbIA) afin
de gérer les ressources faibles et l’adaptation au domaine - en
accordant une attention particulière pour les langues avec des
resources faibles ou moyennes (par exemple, l’occitan, le français)
;
5. Concevoir des modèles DbIA qui peuvent garantir la véracité et
l’explicabilité des informations extraites et synthétisées, tout en
préservant la subjectivité de l’utilisateur.
Coordination du projet
Benjamin Piwowarski (Institut des Systèmes Intelligents et de Robotique)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
ISIR Institut des Systèmes Intelligents et de Robotique
LIG Laboratoire d'Informatique de Grenoble
IRIT Institut de Recherche en Informatique de Toulouse
LIS Laboratoire d'Informatique et Systèmes
Aide de l'ANR 755 979 euros
Début et durée du projet scientifique :
septembre 2023
- 48 Mois