L'espace entre-deux: quand le local rencontre le global dans la vision humaine – WHOLESCENE
La vision a intrigué les chercheurs pendant des siècles et reste toujours énigmatique. Au cours des soixante-dix dernières années, la recherche a poursuit avec succès un programme structuré autour de circuits neuronaux localisés. Dans les expériences comportementales et neurales, les circuits sont généralement caractérisés à l'aide de simples stimuli de laboratoire. Au cœur de ce cadre classique se trouve l'hypothèse que ces circuits neuronaux séparés fonctionnent en grande partie indépendamment les uns des autres et que leur intégration hiérarchique conduit finalement à une reconnaissance complexe d'objets et de scènes. Cependant, ce cadre explicatif s'effondre une fois les stimuli sont mis en contexte, par exemple dans des scènes naturelles. Les circuits locaux ne fonctionnent pas indépendamment. Bien que cette limitation fondamentale soit largement reconnue, la communauté des chercheurs a consacré relativement peu d'efforts à la compréhension de la vision contextuelle dans toute son articulation (c'est-à-dire au-delà des statistiques sommaires et des scènes naturelles). Les quelques tentatives d'aborder la vision contextuelle apparaissent coincées entre deux mondes : les circuits globalement situés d'une part, et la Gestalt phénoménologique d'autre part. Ici, nous proposons un nouveau cadre de vision contextuelle en mariant deux approches conceptuelles/computationelles dirigées par les deux promoteurs, sur la base de leurs travaux parallèles au cours des 15 dernières années.
Peter Neri a étendu les techniques psychophysiques de bas niveau avec de simples stimuli de laboratoire à des stimuli intégrés dans des scènes naturelles. Il a construit des modèles de circuit basés sur des calculs canoniques capables de capturer les aspects locaux liés à la cible de manière très détaillée. Cependant, les aspects globaux de la scène naturelle sont modélisés de manière plus abstraite sans connexion mécaniste aux circuits locaux, manquant ainsi de connaissances informatiques. En parallèle, Michael Herzog a démontré l'importance critique des aspects globaux à longue portée des configurations de stimulus, mais a négligé les aspects liés aux circuits locaux. Autrement dit, l'approche de Neri est principalement influencée par la psychophysique de bas niveau tandis que l'approche de Herzog est principalement influencée par la tradition de la Gestalt, par rapport à l’expérimentation et à la modélisation.
Nous allons d'abord fusionner les deux cadres de modélisation pour créer un modèle générale du processus visuel. Si le modèle réussit, nous le rendrons public. En accompagnant des expériences psychophysiques, nous testerons et affinerons le modèle. En particulier, nous testerons dans quelle mesure les interactions spatiales à longue portée peuvent être expliquées par des chaînes d'interactions locales au sein d'une couche corticale, et/ou si des interactions descendantes sont nécessaires pour prendre en compte l'objectivité. À cette fin, nous mènerons des expériences psychophysiques, fMRI et EEG. A la fin du projet, nous organiserons un atelier avec des experts du domaine.
Ce projet conjoint représente une chance unique de fusionner deux domaines de recherche connexes et de développer un modèle unifié qui guidera les recherches futures sur la vision de niveau intermédiaire.
Coordination du projet
Peter Neri (Ecole Normale Superieure)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
LSP Ecole Normale Superieure
EPFL
Aide de l'ANR 327 022 euros
Début et durée du projet scientifique :
mars 2023
- 48 Mois