Inférence de réseaux d'associations à l'échelle de groupes à partir de données d'abondance avec le modèle PLN-Block
Jeanne Tous  1, *@  , Julien Chiquet  1, *@  
1 : Mathématiques et Informatique Appliquées
AgroParisTech, Université Paris-Saclay, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement : UMR0518
* : Auteur correspondant

Les réseaux d'association constituent un outil utile en écologie pour identifier des relations entre espèces qui ne peuvent être expliquées par les variables environnementales observées, et peuvent donc aider à la compréhension du fonctionnement de systèmes complexes. De tels réseaux peuvent être inférés à partir de données d'abondance, comme des comptages d'espèces en écologie, grâce à PLN-network [Chiquet, Mariadassou et Robin, 2019], une méthode d'inférence de réseaux fondée sur un modèle Poisson-log-normal couplée à une procédure d'estimation de type GLASSO [Friedman et al., 2007]. Cependant, lorsque le volume de données et le nombre d'espèces étudiés augmentent, les réseaux obtenus sont complexes à étudier puisque les associations entre espèces sont identifiées avec des degrés de confiance variés et leur interprétation individuelle est sujette à caution. Il existe des métriques pour agréger l'information contenue dans ces réseaux (nombre total d'associations, intensité moyenne de celles-ci, nombre de cliques dans le réseaux...). Cependant, ces métriques résument la complexité des réseaux à un faible nombre d'informations, nécessairement réductrices. Un compromis entre l'échelle très fine de chaque association et l'échelle globale de ces métriques peut être obtenu par un clustering sur les sommets du graphe et l'inférence d'un réseau à l'échelle des clusters plutôt que celle des espèces. De tels groupes rassembleraient des sommets dont les positionnements vis-à-vis du reste du réseau semblent similaires. Nous proposons le modèle PLN-Block, une méthode d'inférence de réseaux dérivée de PLN-network, qui vise à simultanément effectuer un clustering des espèces étudiées et inférer une structure de réseau entre les clusters, à partir de données d'abondance. Nous introduisons ici ce modèle, discutons les résultats du clustering et les améliorations qui peuvent lui être apportées, notamment pour mieux tenir compte de la nature spécifique des données écologiques. 



  • Poster
Personnes connectées : 2 Vie privée
Chargement...