Estimation non-paramétrique de l'intensité d'un processus ponctuel spatial par forêts aléatoires
Christophe Biscio  1@  , Frédéric Lavancier  2@  
1 : Department of Mathematical Sciences [Aalborg]
2 : Centre de Recherche en Economie et Statistique [Bruz]
Ensai, Ecole Nationale de la Statistique et de l'Analyse de l'Information

La fonction intensité d'un processus ponctuel spatial quantifie le nombre moyen de points par unité de mesure. Il s'agit typiquement de la première caractéristique d'intérêt que l'on cherche à estimer en présence de données réelles. Lorsqu'aucune co-variable n'est observée, son estimation se fait couramment par un estimateur à noyaux. Mais cette approche est mal adaptée à des domaines irréguliers (par exemple non-connexes), et sa consistance n'a lieu que si le nombre de points s'intensifie et pas si le domaine d'observation grandit. Lorsque des co-variables sont observées et que l'intensité en dépend, la situation est a priori plus favorable, mais les estimateurs à noyaux s'avèrent inefficaces : la plupart des études supposent alors une forme paramétrique log-linéaire de l'intensité, qui peut paraître contraignante. Dans ce travail, nous montrons comment adapter l'approche par forêts aléatoires à l'estimation non-paramétrique de l'intensité, avec ou sans présence de co-variables. Cela permet de gérer de façon satisfaisante des domaines non-réguliers et un grand nombre de co-variables, tout en mesurant leur influence. D'un point de vue théorique, lorsque les forêts sont purement aléatoires (ce qui est le cadre naturel sans co-variable), nous étudions la consistance de cette méthode lorsque l'on intensifie les points ou que l'on grandit le domaine d'observation, et ce pour une large classe de processus ponctuels. Nous montrons en particulier que la vitesse de convergence est en général plus rapide lorsqu'on s'appuie sur des co-variables et que l'intensité en dépend.


Personnes connectées : 9 Vie privée
Chargement...