A gradient approximation with importance sampling for dimension reduction in natural exponential families
Bastien Batardière  1, *@  , Julien Chiquet  2, *@  , Joon Kwon  3, *@  , Julien Stoehr  3, 4, *@  
1 : Mathématiques et Informatique Appliquées
AgroParisTech, Université Paris-Saclay, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement : UMR0518
2 : Mathématiques et Informatique Appliquées
AgroParisTech, Université Paris-Saclay, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement : UMR0518
3 : Mathématiques et Informatique Appliquées
AgroParisTech, Université Paris-Saclay, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement : UMR0518
4 : CEntre de REcherches en MAthématiques de la DEcision
Université Paris Dauphine-PSL, Centre National de la Recherche Scientifique, Centre National de la Recherche Scientifique : UMR7534 / URA749
* : Auteur correspondant

Les données de comptage en grande dimension sont difficiles à analyser telles quelles, et les approches fondées sur des modèles statistiques à variable latente restent efficaces et appropriées, tout en préservant l'explicabilité. Nous considérons plus particulièrement ici le cadre de modèles où les données discrètes sont guidées par une variable gaussienne latente décrivant la structure de dépendances des comptages dans un espaces de faible dimension, puis envoyées dans un espace de grande dimension via une distribution de Poisson ou Binomiale. Comme la loi de la variable latente conditionnement aux données reste inconnue, l'inférence variationnelle s'est révélée efficace pour inférer un tel modèle. Cependant, elle ne maximise qu'une borne inférieure de la vraisemblance et les estimateurs correspondant souffrent d'un manque de garanties théoriques. De plus, un grand nombre de paramètres variationnels est nécessaires. Dans ce travail en cours, nous utilisons l'échantillonnage préférentiel pour estimer les gradients de la log-vraisemblance. Nous contrôlons le biais de l'estimateur et nous appuyons sur des théorèmes d'optimisation pour assurer la convergence d'un schéma de gradient stochastique, s'adaptant facilement à un grand nombre d'échantillons.



  • Poster
Personnes connectées : 3 Vie privée
Chargement...