Accueil du site > Séminaires > Probabilités Statistiques et réseaux de neurones > Apprentissage supervisé pour le diagnostic du paludisme à haut-débit : réconcilier des experts en conflit.
Vendredi 20 novembre 2009 à 11h00
Apprentissage supervisé pour le diagnostic du paludisme à haut-débit : réconcilier des experts en conflit.
Anne-Claire Haury (Mines Paristech/INSERM/Institut Curie)
Résumé : Plasmodium est l’agent responsable du paludisme. Quatre types d’espèces infectieuses du parasite ont été recensées chez l’Homme, qui peut être infecté par une, deux, trois ou quatre d’entre elles : Plasmodium falciparum, P. vivax, P. malariae et P. ovale. Un besoin grandissant de méthodes de diagnostic à haut débit se fait ressentir, principalement dû au fait que les quatre espèces se comportent différemment en termes de gravité du pronostic. Il s’agit par conséquent de dresser une carte épidémiologique de l’infection à Plasmodium. Des méthodes de diagnostic - ou experts - existent. Cependant, les médecins ne disposent pas d’un "Gold Standard" et il est courant d’observer des discordances dans les réponses des experts pour un individu donné. FlexiChip est une puce de génotypage dont on peut extraire des données de SNP (mutation d’un nucléotide). Nous utilisons cette puce, adaptée à l’identification, sur un gène de Plasmodium, de SNPs discriminants pour chacune des infections. Notre objectif est de développer un modèle d’apprentissage supervisé, prenant en entrée les données FlexiChip, afin d’identifier les infections simples et multiples. Cependant, l’absence de méthode de référence contraint l’apprentissage, qui doit prendre en compte des exemples ayant des labels discordants. Les résultats sont les suivants : Nous proposons une méthode simple d’apprentissage supervisé, basée sur des SVM (Support Vector Machines), ainsi qu’une fonction de score calculant un indice de confiance avec lequel attribuer un unique label aux exemples pour lesquels les experts sont en conflit. Nous proposons également une évaluation indicative de la sensibilité et de la spécificité de quatre méthodes actuellement utilisées pour le diagnostic.
Travail joint avec Pierre Latouche (CNRS/INRA/Université d’Evry) et Marie-Agnès Dillies (Institut Pasteur)
Dans la même rubrique :
- Jan 15 2010, 11h00 : Validation de processus ponctuels marqués de Gibbs à travers l’analyse des résidus. , Jean-François Coeurjolly (Université P. Mendes-France, Grenoble)
- Jan 08 2010, 11h00 : Classification de variables qualitatives autour de variables latentes. , Vanessa Kuentz (Universités Bordeaux 1 et 2)
- Dec 18 2009, 11h00 : Formule de représentation pour les EDSR dirigées par une martingale continue et application en Finance. , Anthony Reveillac (Université Humboldt, Allemagne)
- Dec 04 2009, 11h00 : Estimation et sélection en classification semi-supervisée , Vincent Vandewalle (Université Lille 1-Lille 2)
- Nov 27 2009, 11h00 : Equation de la chaleur stochastique avec un bruit fractionnaire de dimension infinie , Raluca Balan (Université d’Ottawa)
- Oct 16 2009, 11h00 : Log-periodogram regression on non-Fourier frequencies sets. , Mohamed Boutahar (GREQAM, Université de Marseille-Luminy).
- Oct 09 2009, 11h00 : Sélection de modèles pour la classification non supervisée. , Jean-Patrick Baudry (Université de Paris-Sud)
- Jun 12 2009, 11h00 : Variations and Hurst index estimation for a Rosenblatt process using longer filters. , Frederi Viens (Purdue University, USA)
- Jun 05 2009, 11h00 : Estimation de densité avec des tailles de fenêtres locales : quelques résultats théoriques et des applications possibles. , Catherine Aaron (Université de Clermont-Ferrand)
- Apr 10 2009, 11h00 : Limit theorems for multiple sums of random variables. , Oleg Klesov (University Universität Paderborn, Allemagne and National Technical University of Ukraine)
- Apr 03 2009, 11h00 : Ratio of Generalized Hill’s estimator and its asymptotic normality theory. , Aliou Diop (Université de Saint-Louis, Sénégal)
- Mar 27 2009, 11h00 : Random attractors for stochastic Navier-Stokes equations in some unbounded domains. , Zdzislaw Brzezniak (University of York, UK)
- Mar 20 2009, 11h00 : On the stochastic Landau-Lifshitz’ Equation , Zdzislaw Brzezniak (University of York, UK)
- Feb 27 2009, 11h00 : Un point de vue statistique pour la régularisation de problèmes inverses mal posées et sa connexion avec les méthodes à noyaux. , Anna Karina Firmin (Université Paris X)
- Feb 06 2009, 11h00 : Une extension de l’ACP : les modèles auto-associatifs , Serge Iovleff (Université Lille I)
- Jan 16 2009, 11h00 : Modèles de Markov cachés en météorologie , Pierre Ailliot (Université de Brest)
- Jan 09 2009, 11h00 : Sur l’estimation fonctionnelle par le temps d’occupation , Boris Labrador (L.S.T.A., Université P. et M. Curie)
- Dec 19 2008, 11h00 : Biomarker discovery in MALDI-TOF serum protein profiles using discrete wavelet transformation , Theodore Alexandrov (Université de Breme, Allemagne)
- Oct 31 2008, 11h00 : Joint distribution of the sum and maximum of iid exponential random variables , Anna Panorska (University of Nevada, Reno, USA)
- Oct 24 2008, 11h00 : Estimating space and space-time covariance functions : a weighted composite likelihood approach , Carlo Gaetan (Université de Venise, Italie)