Clustering de marques basé sur l’utilisation des données de navigation des consommateurs

Romain Guigourès - Zalando
vendredi 7 novembre 2014

Créé en 2008 et aujourd’hui implanté dans 14 pays, Zalando est devenu en quelques années le leader européen de la vente de vêtements en ligne. Chaque jour, des milliers d’articles sont vendus et des millions de pages web visitées.

Le département « Data Intelligence » est composé d’une trentaine de personnes issues du milieu de la recherche, réalisant des projets d’analyse de données au service des différentes entités opérationnelles de l’entreprise.
Un des projets développé en 2014 consiste à réaliser un clustering des marques, basé sur les logs de navigations du site web, dans l’objectif d’attribuer aux acheteurs de l’entreprise un groupe de marques ciblant les mêmes consommateurs. Pour ce faire, les marques sont représentées sous la forme d’un graphe, partitionné en optimisant une critère lié à l’information mutuelle. Une mesure de similarité entre les marques est dérivée du critère optimisé afin de quantifier le caractère unique ou interchangeable d’un ensemble de marques.