Modèles graphiques flous pour l’interprétation d’images
Résumé : Les techniques d’interprétation d’images s’appuient
principalement sur les caractéristiques visuelles des éléments
d’intérêt (de bas niveau ou de haut niveau). Toutefois,
l’information spatiale concernant le positionnement relatif de ces
éléments est également bénéfique, comme il a été montré par exemple
dans les problèmes de segmentation et de reconnaissance des
structures. Par conséquent, un intérêt pour l’intégration de
l’information spatiale dans le cadre de l’apprentissage a émergé
récemment. Le fait que l’information spatiale est souvent perçue et
exprimée d’une manière qui est proche du langage naturel, ainsi que
le fait que l’absence d’une interaction spatiale est également
pertinente, font allusion à l’utilité de l’information spatiale floue
pour la représentation de l’image. Les représentations floues
permettent d’évaluer à la fois le degré d’imprécision d’une relation
(par exemple, ’proche de’ ou ’à gauche de’) et la transition graduelle
entre la satisfaisabilité et la non-satisfiabilité d’une relation.
Parmi les solutions utilisées pour adapter les données de l’image aux
entrées des algorithmes d’apprentissage,
nous adoptons une structure de représentation qui encode explicitement
des parties de l’image et des interactions spatiales dans un modèle
graphique. L’objectif des travaux presentés est d’explorer les
techniques de représentation des informations spatiales et leur
intégration dans le processus d’apprentissage, dans le contexte de
classifieurs d’images qui font usage des fonctions noyau de graphes.
Nous motivons notre choix de graphes étiquetés pour représenter les
images, dans le contexte de l’apprentissage avec les classifieurs SVM.
Les fonctions noyau de graphes ont été étudiées en chimie
computationnelle et pour l’étude des systèmes biologiques, et une
adaptation pour les applications aux images est nécessaire, car les
structures représentées et les propriétés de l’information codée dans
l’étiquetage sont fondamentalement différentes. Nous illustrons
l’intégration de l’information
spatiale dans le modèle graphique en tenant compte des mesures
d’adjacence floue
entre les éléments d’intérêt (régions), et on définit une famille de
représentations de graphes déterminés par des seuils différents
appliqués à ces mesures spatiales. Enfin, nous employons plusieurs
méthodes d’apprentissage, afin de construire des classifieurs qui
puissent tenir compte des différentes
représentations graphiques de la même image à la fois. Les résultats
montrent que l’information spatiale complète les caractéristiques
visuelles des éléments
distinctifs dans les images et que l’adaptation des fonctions noyau pour les
représentations spatiales floues est bénéfique en termes de performance.
Cet exposé se tiendra en salle C20-13, 20ème étage, Université
Paris 1, Centre Pierre Mendès-France, 90 rue de Tolbiac, 75013 Paris
(métro : Olympiades).