55èmes Journées de Statistique de la SFdS

sciencesconf.org:jds2024:530666

Semi-LASSO : un weighted LASSO pour l'intégration de régresseurs connus dans un modèle linéaire

Anouk Rago 1, *, @ , Nicolas Champagnat 2, @ , Anne Gégout-Petit 1, @

1 : Institut Élie Cartan de Lorraine

Université de Lorraine, Centre National de la Recherche Scientifique, Inria Nancy - Grand Est

2 : Institut Élie Cartan de Lorraine

Université de Lorraine, Centre National de la Recherche Scientifique, Inria Nancy - Grand Est

* : Auteur correspondant

Le LASSO est une technique très largement utilisée lorqu'il s'agit à la fois d'estimer les paramètres d'un modèle et d'effectuer une sélection de variables. Il est particulièrement utile pour étudier de grands jeux de données, comme cela peut être le cas en biologie des systèmes par exemple, ce qui le rend très utilisé dans le domaine de l'inférence de réseaux de gènes. Cette méthode peut par ailleurs être enrichie et améliorée par des connaissances préalables sur les régresseurs potentiels, afin de guider la sélection de variables. Dans ce cas, on peut employer un weighted LASSO, dérivé du LASSO original, dans lequel l'ajout de poids spécifiques à chaque variable permet d'encoder des a priori. Le package R 'glmnet' permet à l'utilisateur de spécifier ses propres poids via un paramètre. Nous introduisons ici une nouvelle méthode appelée semi-LASSO qui résout un cas spécifique de weighted LASSO. Son implémentation repose sur l'utilisation du package 'glmnet', mais inclut une première étape de réduction de dimension pour une meilleure optimisation de la fonction de coût du LASSO. Des simulations numériques sont effectuées sur des données synthétiques afin de comparer les résultats obtenus avec le weighted LASSO de 'glmnet' et notre méthode semi-LASSO.

Type :	:	oral
Thématiques	:	Grande dimension et parcimonie
Mots-Clés	:	LASSO ; régression ; connaissance a priori ; R ; réseaux de gènes

Poster

Vie privée | Accessibilité