Smoothed Bootstrap et génération de données synthétiques pour la modélisation des extrêmes
Samuel Stocksieker  1, 2@  , Pommeret Denys  1, *@  , Arthur Charpentier  3, *@  
1 : Institut de Mathématiques de Marseille
Aix Marseille Université
2 : Université Claude Bernard Lyon 1
Université de Lyon
3 : Université du Québec à Montréal = University of Québec in Montréal
* : Auteur correspondant

En apprentissage supervisé, il est assez fréquent de se retrouver confronté à des données présentant des distributions déséquilibrées. Cette situation entraîne souvent une difficulté d'apprentissage pour les algorithmes standards. La recherche et les solutions en matière d'apprentissage à partir de distributions déséquilibrées se sont principalement concentrées sur les tâches de classification. Malgré son importance, très peu de solutions existent pour la régression déséquilibrée (Imbalanced Regression). Dans cet article, nous proposons une procédure d'augmentation de données, nommée DENIS, basée sur des estimations à noyau de densité.
Cette approche fournit une expression des densités conditionnelles des générateurs. Nous appliquons DENIS en régression déséquilibrée et proposons de le combiner à une nouveau type de générateur de type Wild-Boostrap pour simuler la variable cible, conditionnellement aux nouvelles données synthétiques. Nous évaluons les performances de l'algorithme DENIS dans des situations de régression déséquilibrée. Nous évaluons empiriquement et comparons notre approche et démontrons une amélioration significative par rapport aux techniques existantes.



  • Poster
Personnes connectées : 5 Vie privée
Chargement...