APPR - Apprentissages 2013

Renforcement et mouvements oculaires – REM

Reinforcement and eye movements

We will experimentally probe the idea that motor learning rely on reinforcement contingencies by addressing four challenging questions in the field. First we will test the effects of learning on saccade reaction time. Second we will probe whether saccade kinematics may be controlled by reinforcement. Third we will test whether saccade adaptation depends on visually guided tasks. Fourth we will expand our reinforcement learning hypothesis to smooth pursuit eye movements. These experiments will provide the basis for developing an original computational learning model based on Bayesian probabilistic theories. Overall we expect this project to considerably enhance our knowledge of eye movement plasticity and provide a well-defined and solid general framework for studying other forms of motor learning.

How motor learning continuously adjusts eye movements to produce a lifetime of accurate movements

The project involves conventional behavioral techniques such as
psychophysics, eye movement measurement and analysis, computer generation of complex visual stimuli
and computational modeling. On all these aspects, the participants have a strong expertise as evidenced from
their track records. They all use state-of-the-art recording and analysis techniques, as briefly described
below.
Eye movements recording and computer image generation: We all have a long-standing history of
recording eye movements in humans. Both sites are equipped with identical state-of-the-art video eye
trackers (EyeLink 1000) allowing noninvasive recording of tracking as well as saccadic eye movements at
high spatial (<0.1°) and temporal (1KHz) resolutions. Both sites use the same tools for design and display of
calibrated stimuli (PsychToolbox). These tools are already integrated with the eye movement recording
systems so that gaze contingent paradigms may easily be implemented. Importantly, using similar recording
and stimulating apparatus on both sites allows us to easily share experimental protocols and data analysis.
Computational models: Marseille partner have a strong experience in computational behavioral science,
in particular biologically realistic neural networks models as well as Bayesian inference. These different
methodological aspects are intermingled in the four scientific tasks described below.

Résultats

-- T1 focuses on experiments addressing the effects of learning on saccade latencies
-- T2 probes the possibility that saccade peak velocity may be controlled by reinforcement
-- T3 tests whether saccade adaptation depends on visually guided discrimination tasks
-- T4 expands our reinforcement learning hypothesis to smooth pursuit eye movements
-- T5 aims at communicating the results to Masters and PhD students involved in the two academic
institutions.
-- In addition, we propose to use Bayesian models to account for motor learning. These models will be
tested within each task, allowing comparisons across paradigms and behavioral variables.
-- Finally, the integration of the experimental results in a unified theoretical framework will enhance
and amplify the impact of our work.

Perspectives

Probabilistic models of learning. A good learning strategy would efficiently explore different
movement properties while maintaining a memory of past movements and their associated rewards. Within a
decision theoretic framework such a strategy can be formalized using Bayesian decision theory. The optimal
decision to approximate the target behavior combines the best present estimate (likelihood) with information
about past (prior) trials. Bayesian models based on these assumptions will be tested against our experimental
data.

Productions scientifiques et brevets

TBA

Résumé de soumission

Nous contrôlons nos mouvements pour un grand nombre de comportements allant du basket au piano ou au jonglage. D’un point de vue théorique notre capacité à faire un simple mouvement des yeux ou du bras est tout à fait extraordinaire. De manière encore plus étonnante, nous pouvons maintenir la précision de ces mouvements malgré les changements qui se produisent dans l’environnement ou au sein des systèmes moteurs, et l’une des questions majeures pour la psychologie concerne la capacité des organismes vivants à constamment maintenir les comportements moteurs adaptés au cours de la vie. Plus généralement, les questions concernant les relations entre contraintes internes et contraintes environnementales pour les comportements et les apprentissages est fondamentale. Le but de ce projet de recherche fondamentale est d’apporter un éclairage nouveau sur ces questions en utilisant des paradigmes expérimentaux contrôlés combinés à des modèles computationnels dynamiques dans un cadre théorique unifié.
Comparativement à d’autres domaines de recherches; le contrôle moteur a été largement étudié en se fondant sur les modèles servo-mécanistes mais ne propose pas d’outils théoriques pour rendre compte des apprentissages. Par exemple, les modèles du contrôle optimal supposent que la programmation des mouvements repose sur la minimisation de fonctions de couts mais ne prennent pas en compte les conséquences fonctionnelles des comportements. Par ailleurs, l’apprentissage par renforcement est fondé sur l’hypothèse voulant que les comportements soient fonctions de leurs conséquences. Il est important de noter que, malgré quelques récentes recherches, les effets de l’apprentissage par renforcement sur le control moteur restent très mal connus.
Nous proposons d’utiliser les mouvements de saccades et de poursuite lisse comme modèle pour l’apprentissage moteur. Les mouvements oculaires ont été beaucoup étudiés au cours des dernières décades à la fois au niveau comportemental et neurophysiologique pour rendre compte du contrôle moteur. De plus ces mouvements sont extrêmement plastiques ce qui rend possible l’exploration des dynamiques de l’apprentissage au cours de l’acquisition d’habiletés motrices.
Nous testerons expérimentalement l’idée selon laquelle l’apprentissage moteur s’appuie sur les contingences de renforcement en nous attaquant à quatre verrous conceptuels de la discipline. En premier lieu nous explorerons les effets de l’apprentissage sur les latences saccadiques. Puis nous testerons si la cinématique des saccades peut être contrôlée par renforcement. Ensuite nous testerons la possibilité d’induire une adaptation saccadique en utilisant une tâche de discrimination visuelle. Finalement nous étudierons l’effet du renforcement sur l’apprentissage de la poursuite lisse. Ces expériences fournirons une base pour le développement d’un modèle computationnel de l’apprentissage fondé sur une approche Bayesienne. D’une manière générale, ce projet nous permettra de mieux appréhender la plasticité des systèmes oculomoteurs et fournira un cadre théorique formel pour étudier d’autres formes d’apprentissages moteurs.

Université

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

CNRS DR12 _ INT Centre National de la Recherche Scientifique Délégation Provence et Corse _ Institut de Neurosciences de la Timone

Aide de l'ANR 435 080 euros
Début et durée du projet scientifique : février 2014 - 42 Mois

Explorez notre base de projets financés

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.