Classification de variables qualitatives autour de variables latentes.

Vanessa Kuentz (Universités Bordeaux 1 et 2)
vendredi 8 janvier 2010

Résumé : Les méthodes de classification de variables permettent
d’organiser les variables en classes homogènes afin de faire ressortir
une structure. Il est alors possible de sélectionner une variable, ou
construire une variable synthétique, dans chaque groupe. Dans cette
présentation, nous étendons le critère utilisé par Vigneau et Qannari
(2003) dans leur approche de classification de variables quantitatives
autour de variables latentes (CLV pour Clustering around Latent
Variables) au cas de variables qualitatives. Le critère d’homogénéité
d’une classe de variables qualitatives est défini comme la somme des
rapports de corrélation entre les variables qualitatives et une
variable latente, qui dans ce cas est numérique. Nous montrons que la
variable latente d’une classe peut être obtenue par une Analyse des
Correspondances Multiples. Différents algorithmes sont proposés pour
la classification de variables qualitatives (algorithme de
réallocation de type nuées dynamiques, classification hiérarchique
ascendante et descendante) et sont illustrés sur des données réelles.


Cet exposé se tiendra en salle C20-13, 20ème étage, Université
Paris 1, Centre Pierre Mendes-France, 90 rue de Tolbiac, 75013 Paris
(métro : Olympiades).