Partenaires

CNRS
Logo tutelle
Logo tutelle
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Séminaires > Probabilités Statistiques et réseaux de neurones > Estimation et sélection en classification semi-supervisée

Vendredi 4 décembre 2009 à 11h00

Estimation et sélection en classification semi-supervisée

Vincent Vandewalle (Université Lille 1-Lille 2)

Résumé : Notre présentation porte sur la classification semi-supervisée qui est considérée d’un point de vue décisionnel. Nous nous intéressons à la question du choix de modèles dans ce contexte où les modèles sont estimés en utilisant conjointement des données étiquetées et des données non étiquetées plus nombreuses. Nous concentrons notre recherche sur les modèles génératifs où la classification semi-supervisée s’envisage sans difficulté, contrairement au cadre prédictif qui nécessite des hypothèses supplémentaires peu naturelles. Après avoir dressé un état de l’art de la classification semi-supervisée, nous décrivons l’estimation des paramètres d’un modèle de classification à l’aide de données étiquetées et non étiquetées par l’algorithme EM. Nos contributions sur la sélection de modèles sont les suivantes. Tout d’abord, nous présentons un test statistique où les données non étiquetées sont utilisées pour mettre à l’épreuve le modèle utilisé. Ensuite, nous présentons un critère de sélection de modèles, AIC_{cond}, dérivé du critère AIC d’un point de vue prédictif. Nous montrons la convergence asymptotique de ce critère particulièrement bien adapté au contexte semi-supervisé et ses bonnes performances pratiques comparé à la validation croisée et à d’autres critères de vraisemblance pénalisée.

Dans la même rubrique :