Partenaires

CNRS
Logo tutelle
Logo tutelle
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Séminaires > Mathématiques des systèmes complexes > La classification d’observations à labels imprécis / incertains.

Vendredi 28 novembre 2008 à 11h00

La classification d’observations à labels imprécis / incertains.

Etienne Côme (INRETS - LT)

Résumé : Cette intervention présente une solution aux problèmes de classification faisant intervenir des données d’apprentissage labellisées de manière imprécise et incertaine. Tous les exemples utilisés pour l’apprentissage, sont décrits classiquement par un vecteur de descripteurs xi , mais, dans notre cas, également par une étiquette imprécise et/ou incertaine mi, spécifiant de manière « douce » l’appartenance de l’individu aux différentes classes d’intérêt. Nous proposons d’utiliser comme étiquette une fonction de masse de croyance. Le problème d’apprentissage est donc traité dans le cadre de la théorie des fonctions de croyance, ce qui permet une grande souplesse dans la définition des étiquettes. Cette approche généralise ainsi différents problèmes d’apprentissage couramment rencontrés dans la littérature : supervisé, non supervisé, semi supervisé, partiellement supervisé, que nous présenterons successivement. Pour résoudre le problème de classification, la solution décrite fait l’hypothèse que les données sont générées suivant un modèle de mélange (approche générative). Nous montrerons que dans ce cadre, il est possible de dériver grâce au théorème de Bayes généralisé un critère qui étend les critères de maximum de vraisemblance associés aux différents problèmes d’apprentissage mentionnés. Nous présenterons également un algorithme de type EM dédié à l’optimisation de ce critère et permettant d’obtenir une estimation des différents paramètres du modèle. Finalement, nous donnerons des résultats de simulation sur des bases de données de référence mettant en évidence l’intérêt d’une telle approche, en particulier pour traiter élégamment les problèmes résultant d’erreurs d’étiquetages.

Dans la même rubrique :