Estimation consistante du nombre de clusters non vides dans les modèles de mélange bayésiens par régression sur profils d'exposition. Application en épidémiologie des rayonnements ionisants
Julie Fendler  1@  , Sophie Ancelet, Chantal Guihenneuc@
1 : Laboratoire d'épidémiologie des rayonnements ionisants  (IRSN/PSE-SANTE/SESANE/LEPID)
Service de recherche sur les effets biologiques et Sanitaires des rayonnements ionisants

Depuis sa définition par Wild (2005), l'exposome est de plus en plus mis en avant pour son rôle dans l'apparition et le développement de maladies multifactorielles telles que le diabète, le cancer ou l'asthme. Cependant, les données d'exposome sont des données de grande dimension, souvent composées de variables fortement corrélées entre elles (multi-colinéarité). Pour l'analyse de données multi-colinéaires, des méthodes statistiques spécifiques sont nécessaires. Parmi elles, les modèles de mélange bayésiens par régression sur profils d'exposition (BPRM). Ces modèles hiérarchiques permettent de former des groupes d'individus ayant des profils d'exposition similaires à plusieurs facteurs de risque et d'estimer un risque sanitaire pour chacun de ces groupes. La répartition des individus en groupes et l'estimation du risque sanitaire associé se font conjointement sous le paradigme bayésien. Dans les modèles BPRM, le sous-modèle permettant l'attribution de chaque individu à un groupe repose sur un processus de Dirichlet latent, pour lequel l'estimation du nombre de groupes non vides est connue pour être inconsistante. Notre cas d'application demandant d'estimer un nombre interprétable de groupes non vides en présence de données faiblement informatives, nous proposons d'adapter l'algorithme MCMC d'inférence desmodèles BPRM afin de faciliter l'estimation du paramètre de concentration du processus de Dirichlet latent, dans une situation où le signal dans les données est faible. Enfin, nous adaptons aux modèles BPRM et nous comparons différentes méthodes de post-traitement afin de permettre la consistance du nombre estimé de groupes non vides. 



  • Poster
Personnes connectées : 5 Vie privée
Chargement...