Inférence Post-Clustering
Nicolas Enjalbert Courrech  1, *@  , Pierre Neuvial, Cathy Maugis-Rabusseau@
1 : Institut de Mathématiques de Toulouse UMR5219
université Toulouse 1 Capitole, Institut National des Sciences Appliquées - Toulouse, Université Toulouse - Jean Jaurès, Université Toulouse III - Paul Sabatier, Centre National de la Recherche Scientifique : UMR5219
UPS IMT, F-31062 Toulouse Cedex 9, INSA Toulouse, F-31077 Toulouse,France UT1, F-31042 Toulouse, France UT2, F-31058 Toulouse,Téléphone : 05.61.55.67.90 -  France
* : Auteur correspondant


On s'intéresse au problème de ”double-dipping” c'est-à-dire à l'utilisation du même jeu de données pour faire d'abord un clustering des observations puis un test statistique dont l'hypothèse nulle dépend des classes obtenues à l'étape prédente. Dans un premier temps, nous effectuons un état de l'art des nombreuses approches récemment proposées pour ce problème, en
les regroupant en deux catégories : les méthodes de partitionnement de l'information et les approches conditionnelles. Ensuite, nous proposons une comparaison numérique afin d'évaluer leur performance en termes de contrôle du risque de première espèce, de puissance statistique, et de temps de calcul.



  • Poster
Personnes connectées : 4 Vie privée
Chargement...