Partenaires

CNRS
Logo tutelle
Logo tutelle
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Séminaires > Mathématiques des systèmes complexes > Modèles de mélange gaussien pour la classification des données de grande dimension

Vendredi 12 Octobre 2007 à 11h

Modèles de mélange gaussien pour la classification des données de grande dimension

Charles Bouveyron (Université Paris 1)

Résumé : Partant du postulat que les données de grande dimension vivent dans des sous-espaces de dimensions intrinsèques inférieures à la dimension del’espace original et que les données de classes différentes vivent dans des sous-espaces différents dont les dimensions intrinsèques peuvent être aussi différentes, nous proposons une re-paramétrisation du modèle de mélange gaussien. En forçant certains paramètres à être communs dans une même classe ou entre les classes, nous exhibons une famille de 28 modèles gaussiens adaptés aux données de grande dimension, allant du modèle le plus général au modèle le plus parcimonieux. Ces modèles gaussiens sont ensuite utilisés pour la discrimination et la classification automatique de données de grande dimension. Les classifieurs associés à ces modèles sont baptisés respectivement High Dimensional Discriminant Analysis (HDDA) et High Dimensional Data Clustering (HDDC) et leur construction se base sur l’estimation par la méthode du maximum de vraisemblance des paramètres du modèle. La nature de notre re-paramétrisation permet aux méthodes HDDA et HDDC de ne pas être perturbées par le mauvais conditionnement ou la singularité des matrices de covariance empiriques des classes et d’être efficaces en terme de temps de calcul.

Dans la même rubrique :