Partenaires

CNRS
Logo tutelle
Logo tutelle
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Séminaires > Mathématiques des systèmes complexes > Les représentations multidimensionnelles doivent tenir compte du fléau de la dimension.

Vendredi 6 avril 2007 à 11h

Les représentations multidimensionnelles doivent tenir compte du fléau de la dimension.

Sylvain Lespinats (INSERM unité U722), lespinats@bichat.inserm.fr

Résumé : La visualisation de données de grande dimension se fait généralement par projection dans un espace bi- ou tri-dimensionnel. Une représentation de ce type ne peut que rarement être parfaite, et est donc souvent le fruit d’un « point de vue » selon lequel on considère les données. Par exemple on peut maximiser l’inertie du nuage projeté (Analyse en Composantes Principales), chercher les axes qui permettent de discriminer les données selon des classes connues au préalable (analyse discriminante), etc. Suivant le point de vue que l’on considère, il peut être important de prendre en compte les propriétés singulières des espaces de grande dimension, en particulier le phénomène de concentration de la mesure. Nous nous intéressons ici à deux points de vue. Le premier est classique, il s’agit de visualiser les distances entre voisins : les contraintes sur les distances les plus longues sont relâchées pour maximiser la préservation des distances courtes. Dans ce cadre, nous proposons DD-HDS (Data-Driven High Dimensional Scaling) : une méthode de représentation des données originale tenant compte de la concentration de la mesure, et pénalisant à la fois les « faux voisinages » (données éloignées représentées comme proches) et les « déchirements » (données proches représentées comme éloignées). Le second point de vue ne se base pas sur la préservation des distances courtes, mais sur la préservation des rangs de voisinage faibles. La méthode de représentation RankVisu s’attache à conserver cette caractéristique essentielle du jeu de données.

Dans la même rubrique :