55èmes Journées de Statistique de la SFdS

sciencesconf.org:jds2024:550349

Les modèles génératifs basés sur le score (SGM), aussi connus sous le nom de modèles de diffusion, visent à estimer une distribution en estimant des fonctions de score à l'aide d'échantillons perturbés issus de la distribution cible. Ces méthodes ont permis l'obtention de résultats empiriques très impressionnants dans différents domaines complexes (traitement d'image, séries temporelles, etc.) et garantissant des performances au-delà des méthodes de l'état de l'art. Dans cet exposé, nous présenterons de nouvelles méthodes de simulation de lois a posteriori basées sur ces approches.

Tout d'abord, les modèles génératifs basés sur le score ont récemment été appliqués avec succès à différents problèmes inverses avec des applications par exemple en imagerie médicale. Dans ce cadre, nous pouvons exploiter la structure particulière de la loi a priori définie par le SGM pour définir une séquence de problèmes inverses intermédiaires. À mesure que le niveau de bruit diminue, les lois a posteriori de ces problèmes inverses se rapprochent de la loi cible du problème inverse initial. Pour échantillonner cette séquence de lois, nous proposons d'utiliser des méthodes de Monte Carlo séquentielles (SMC). L'algorithme proposé, MCGDiff, bénéficie de garanties théoriques pour la reconstruction des lois cibles et diverses simulations numériques illustrent qu'il est plus performant que les méthodes concurrentes lorsqu'il s'agit de traiter des problèmes inverses mal posés dans un cadre bayésien.

Par ailleurs nous nous intéresserons aux applications où des simulateurs complexes sont utilisés, ce qui signifie que la vraisemblance (loi des observations sachant les paramètres du modèle) de ces modèles est généralement difficile à calculer. L'inférence basée sur la simulation (SBI) se distingue dans ce contexte en ne nécessitant qu'un ensemble de données issues de simulations pour former des modèles génératifs capables d'approcher la distribution a posteriori des paramètres d'entrée du simulateur sachant une observation donnée. Nous considérerons un cadre “grande échelle” dans lequel de multiples observations sont disponibles et où l'on souhaite tirer parti de leurs informations partagées pour mieux déduire les paramètres du modèle. Nous présenterons une méthode s'appuyant sur les SGM permettant d'estimer la distribution a posteriori simplement en utilisant les informations du réseau de scores formé sur des observations individuelles. Nous comparerons notre méthode à des approches concurrentes récemment proposées et démontrerons sa supériorité en termes de stabilité numérique et de coût de calcul.

Type :	:	oral
Thématiques	:	Session invitée semi-plénière
Mots-Clés	:	Modèles génératifs ; Modèles de diffusion ; Score based models ; Lois a posteriori ; Simulation based inference

Vie privée | Accessibilité