Apprentissage séquentiel en observation partielle.

Vianney Perchet (ENS Cachan)
vendredi 1er avril 2011

Résumé : L’apprentissage est séquentiel lorsque les données arrivent "à
la volée" et sont traitées les unes après les autres (par exemple pour
donner
une étiquette, prendre une décision, prédire la prochaine donnée,
etc.) en vue d’optimiser un critère cumulé (comme minimiser le nombre
d’erreurs, maximiser la moyenne de paiements, etc.). Les exemples
types de ces modèles sont les problèmes d’allocations dynamiques de
ressources ou d’envois de données dans un réseau ; cela dit, on
montrera qu’ils peuvent également être pertinents en apprentissage
statistique, notamment pour la classification. On présentera dans cet
exposé un algorithme adapté à des données incomplètes, manquantes,
bruitées — les observations sont dites partielles — et
non-nécessairement stochastiques (ou "prédiction de suites
individuelles"). L’utilisation de techniques d’estimation issues des
bandits-manchots et de la théorie des jeux permettent d’obtenir, pour
la première fois dans ce cadre général, une vitesse de convergence
optimale.


Cet exposé se tiendra en salle C20-13, 20ème étage, Université
Paris 1, Centre Pierre Mendès-France, 90 rue de Tolbiac, 75013 Paris
(métro : Olympiades).