Spatial Autoregressive Model on a Dirichlet distribution
Teo Nguyen  1, 2, *@  , Sarat Moka  3@  , Kerrie Mengersen  4@  , Benoit Liquet  1, 2, *@  
1 : CNRS/Univ Pau & Pays Adour, Laboratoire de Mathématiques et de leurs Applications de Pau - Fédération MIRA, UMR 5142, 64600 Anglet, France
UMR 5142
2 : Macquarie University
3 : University of New South Wales
4 : Queensland University of Technology
* : Auteur correspondant

Les données de composition sont largement utilisées dans divers domaines tels que l'écologie, la géologie, l'économie et la santé publique, car elles représentent les proportions ou les pourcentages des différents ékéments composant un ensemble. Toutefois, en raison de leur nature relative et de leur contrainte de vivre dans un simplexe, les méthodes statistiques traditionnelles ne sont pas directement applicables aux données de composition (Aitchison 1982).
Des dépendances spatiales existent souvent dans les données de composition, en particulier lorsque les composantes représentent des différentes répartitions des terres ou bien des variables écologiques. L'auto-corrélation spatiale peut résulter de conditions environnementales communes ou de la proximité géographique. Il est donc essentiel d'incorporer des informations spatiales dans l'analyse statistique des données de composition afin d'obtenir des résultats précis et fiables. Pour traiter les données compositionnelles, la distribution de Dirichlet est couramment utilisée car son support est un vecteur compositionnel. Maier (2014) a proposé un modèle de régression pour les données à distribution de Dirichlet, mais ce modèle ne prend pas en compte les dépendances spatiales, ce qui limite son applicabilité aux problèmes spatiaux.
Dans cette étude, nous présentons un modèle autorégressif spatial pour des données suivant une distribution de Dirichlet qui incorpore des dépendances spatiales entre les observations. Nous développons un estimateur du maximum de vraisemblance sur une fonction de densité de Dirichlet qui inclut un terme dit de "spatial lag". Nous comparons ce modèle autorégressif spatial au même modèle sans "spatial lag" et testons les deux modèles sur des ensembles de données synthétiques et réelles. Différentes matrices de poids spatiales sont utilisées pour tenir compte de leur effet sur l'ensemble des données synthétiques.
Les résultats démontrent que l'incorporation des dépendances spatiales peut améliorer la performance du modèle et confirment que l'efficacité dépend de la définition de la matrice des poids (Anselin 1988). En tenant compte des relations spatiales entre les observations, notre modèle fournit des résultats plus précis et plus fiables pour l'analyse des données de composition. Les recherches futures pourraient explorer plus en détail l'application du modèle proposé dans différents domaines et étudier d'autres matrices de poids pour l'analyse des données de composition dans divers contextes spatiaux.



  • Poster
Personnes connectées : 5 Vie privée
Chargement...