Calibration en vision stéréo par méthodes statistiques – Callisto
L'usage de caméras comme instruments de mesure a été l'idée fondatrice de la photogrammétrie. Alors que l'arpentage général vise quelques mesures à haute precision, des estimations denses avec une précision controlée devraient être possibles à grande échelle. Il n'existe pas de système peu onéreux de mesure dense 3D : le plus courant, LIDAR, est cher et exige du matériel supplémentaire lors de la prise de données. Le principe de la vision stéréo est simple : en comparant les observations d'une même scène de différents points de vue, l'information sur la géométrie de la scène peut s'en déduire. Pour des géométries relativement complexes, de nombreuses vues sont nécessaires pour éviter les occlusions. Comme tout instrument de mesure, les caméras utilisées dans ce but doivent être calibrées. Il y a deux parties dans le processus de calibration : l'estimation des paramètres internes, comme la focale, la taille des pixels, la position du point principal, et les paramètres externes du système, c'est-à-dire les positions et orientations relatives des différentes vues. Le résultat le plus important de la calibration interne devrait être la correction de la distorsion géométrique. C'est la déviation de la caméra sténopée parfaite, modèle qui est à la base de toute la vision stéréo. Les techniques de référence, ajustant un modèle paramétrique de distorsion, se sont montrées déficientes expérimentalement, avec des erreurs résiduelles de plusieurs pixels. Ce projet vise à résoudre le problème en abandonnant la recherche de la distorsion exacte mais en estimant le meilleur repli : la 'caméra mathématique équivalente', dont la distorsion est corrigée par un modèle non paramétrique. C'est une caméra sténopée dont les paramètres internes peuvent ne pas être les réels, mais qui s'insère dans la théorie complète de la vision stéréo. La calibration externe se fait habituellement par ajustement de faisceaux. Cette minimisation d'une énergie non convexe se bloque facilement dans un des nombreux minima locaux. Une bonne estimation initiale des positions et orientations relatives est indispensable. La nature incrémentale habituellement adoptée de cette estimation initiale rend le résultat dépendant d'un ordre entre les images, ce qui est un point d'achoppement à la reconstruction entièrement automatique en présence d'images multiples. En se basant sur un travail doctoral très récent de Martinec, le projet proposera une calibration externe globale et précise. Un prérequis pour ces tâches est d'avoir de nombreuses correspondances précises de points d'intérêt entre images. Le progrès des dernières années en traitement d'images nous a apporté de tels points fiables : les SIFT, MSER et variantes. Néanmoins, les contraintes sévères dans leur mise en correspondance doivent être relachées et adaptées pour obtenir plus de bonnes correspondances. Ceci coûte le risque de fausses correspondances en surplus. Elles seront gardées sous contrôle par l'usage de méthodes a contrario, qui ont vu un succès grandissant dans un certain nombre de traitements d'image récemment. Tout au long du projet, ces méthodes a contrario seront évaluées par rapport à des méthodes récentes de statistique, comme le test d'hypothèses multiples. Un estimateur aléatoire en présence d'aberrations, très populaire en vision artificielle, RANSAC (Random Sample Consensus), sera examiné à la lumière des dernières techniques statistiques. Grâce a un contrôle statistique de la précision, ce projet offrira une calibration précise en vision stéréo, une étape préalable cruciale dans la chaîne des traitements stéréo.
Coordination du projet
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
Aide de l'ANR 380 586 euros
Début et durée du projet scientifique :
- 0 Mois