Nous proposons une méthodologie complète pour évaluer et cartographier le risque de présence de la bactérie Xylella fastidiosa en intégrant les composantes spatiales dans le processus de modélisation. Notre approche est basée sur l'apprentissage automatique, tenant compte des particularités des données : hétérogénéité spatiale et déséquilibre. Une pré-sélection de facteurs est réalisée à l'aide d'une approche ensembliste couplée à une validation croisée spatiale. Nous proposons ensuite une adaptation du modèle XGBoost dans laquelle les composantes spatiales sont intégrées au modèle, notamment en considérant des facteurs spatialement pondérés et en basant la sélection de modèle sur une validation croisée par blocs environnementaux. Cette approche nous permet d'obtenir un modèle robuste, généralisable à une zone géographique éloignée de celle utilisée pour l'entraînement du modèle et donc adaptée à l'extrapolation.
- Poster