WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp

Home | Publier un mémoire | Une page au hasard

Memoire Online >

Commerce et Marketing

Estimation non-paramétrique par noyaux associés et données de panel en marketing

( Télécharger le fichier original )
par Imen Ben Khalifa
Ecole Supérieure de la Statistique et de l'Analyse de l'Information - Ingénieur en statistique et analyse de l'information 2008

précédent sommaire suivant

2.1.7 Choix de fenetres

a. Importance du choix de h

Le parametre de lissa_ge h est un réel positif dont le choix est prépondérant sur celui du no_yau continu s_ymétri_que K. Le choix d'une valeur de h trop_grande conduit a une courbe trop lisse. La courbe estimée ne traduit pas suffisament les variations de la vraie distribution (voir fi_gure 2.3).

FIG. 2.3???str?t?? ????_??e??e?? ?? s?s???ss?_?? ?rs ?? ??et???t?? ????? ???n?it

Ep/0/ch0-

RIM .

-2 -1 0 1 2 3

Par contre, en choisissant un parametre de lissa_ge tres petit_que celui adopté précédemment, l'allure de la distribution chan_ge. Il sa_git dune distribution surestimé (fi_gure 2.4).

FIG. 2.4 -- ???str?t?? ????_??e??e?? ?? s?r???ss?_?? ?rs ?? ??st???t?? ????? ???n?it

Ep/0/ch0-

D..

-2 -1 0 1 2 3

ment la distribution de depart (fi_gure 2.5). Les courbes obtenues illustrent a_quel point
FIG. 2.5 -- Illustration d'une estimation ideale

Ep/0/00-

RI.

-2 -1 0 1 2 3

les formes estimees sont differentes en fonction de lordre de_grandeur du paramètre de lissa_ge. La principale difculte repose sur le choix optimal de la fenetre h. La valeur ideale hid du parametre h est celle_qui minimise l'erreur_quadrati_que mo_yenne inte_gree (MISE). Pour une taille d'echantillon n donnée et un no_yau K fixe, nous avons

? AMISE(h) = 0.

Ce_qui est e_quivalent a

h³V (K)² I f^" (x)2dx 1 2_jalⁱ K(t)²dt = 0.

Ainsi, nous obtenons successivement

nh⁵V (K)² ff^" (x)²dx = K(t)²dt R

h⁵ = nV (K)² f_R f^"(x)²dx

fR K(t)2dt

1 I f_R K(t)²dt1^1/5

hid = v .

V(K)² f_R f^" (x)2dx (2.13)

En particulier pour K = KEpanechn., nous avons

~ 15 \1/5

hid(KEpanechn.) =

n_R .

R f"(x)2dx

En definitive, a partir de (2.13), nous obtenons

2/5 4/5₁1/5

5 1

AMISE(hid) =

_L,_Rt²K(t)dt1 { K(t)²dt1 { f^" (x)²dx

4 n4/5 R R

₅1/5

4n4/5 I(K) f_R f^"(x)² dx }

avec

~Z _~2/₅ ~Z ~4/5

I(K) = t²K(t)dt K(t)²dt .

R R

Consé_quences:_Quand n est_grand, hid tend vers 0. Le parametre de lissa_ge h idéal dépendenfaitdeladensitéatravers f^".Ainsipourun hpetit,nousavonsunpetitbiais et une variance plus_grande. Le no_yau optimal est obtenu en minimisant R R K(t)2dt, ceci en admettant les h_ypotheses (2.4) et (25).

b. Méthodes de choix de fenêtres

Nous considéronss donce avec plus d'intérêtt la_question de selection du parametree de lissa_ge h. Comme fenêtree optimale, nous choisissons la valeur_qui minimis lee MISE.

Nous étudions trois méthodes dans la déterminationn du parametre d lissagee^optimalh_opt:: le "Plu_g-in", la validation croisée par moindres carrés e laa validation croisée par maximum de vraisemblance.e

b.1. Mahodee Pln_g-inn

Dans la procéduree de Plu_g-in,l'idée& de base est destimerr dan lexpressionn (2.13) la_quantité inconnue: : f_R f^"(x)²dx. En effet, ilt_y a deux approches possibles pou ^leefaire:: soit nous supposons_que la densité f appartient a une famille de distributions

paramétri_ques et la nous estimons les parametres et nous retrouvon facilement cette cette _quantité, soit nous l'estimons par lapprochee non-paramétri_que et donce faire appel a un estimateur a no_yau (par exemple). Ceci va compli_quer davanta_g less calculs parce_que nous trouvons une fonction_qui dépendd elle même de h. Donc,, en_gros, la méthode Plu_g-in résidee a "in_jecter" une estimation de f en adoptant une méthode commode et prati_que. Dans notre étude,, nous supposons_que f(x) appartient a une famille de distribution normale centrée et de variance ó²..

Sous cette hypothese::

ZR _R f"(x)2dx =_{88 0r}³³ó^-1/⁵⁵0.212ó^-1/⁵..

Il reste alors a remplacer le parametre inconnu óa par la valeur estiméee bó.. Nous choisissons la valeur empiri_que comme valeur optimale définiee comme suit

_bó

n -- 1

^Xn
i=1i

tu u v

(Xii -- X~²,,

tel_que XX = n-¹¹ (X1 + X2 + .
· .
· .
· + Xn).

(4ð)-1/10

8ð-1/2 bó

~ ~3 ~-1/5

n1/5 5

Le résultatt obtenu sera remplacée dans la formule de hid et nous avons

hopt

(4bó⁵⁵~^1/5

= 3n ~ bó)= =1.06 6n1/55)

Ce_que nous avons accompli en travaillant sous la supposition de la normalité estest une formule explicite applicable pour la selection de la fenetre h. En réalité, cette méthode donne des résultats raisonnables pour toute les distributions s_ymétri_ques, unimodales et ne possédant pas des_queues trop lourdes Le probleme donc avec cette méthode est_qu'elle est tres sensible aux valeurs aberrantes. Un estimateur plus robuste dans ce cas est obtenu a partir de l'intervalle inter_quartile : R =

X[0.75n] - X[0.25n] o1 Xp

dési_gnele_quantiled'ordrepd'une N (u,ó²).Ladifférenceentrecesdeux_quartilesdonne 50% de l'ensemble des observations. En supposant tou_jours_que X suit une normale N(u,ó²), nous posons Z = (X - u)/ó_qui suit une N(0,1). Ainsi, nous montrons_que (X[0.75n] -X[0.250 = 1.34ó Par consé_quent, un estimateur puissant de ó serait Q = R/(1.34). Dans ce cas, le parametre de lissa_ge optimal est donné par

~ hopt = 1.06 1R.34 n-1/5 0.796n^-1/⁵. Enfin, la fenetre optimale est

hopt = 1.06 min bó,

1.34
R

_n-1/5

Cette méthode présente des inconvénients : si la vraie densité f devie substantiellement delaformed'unedistributionnormale(enétantmultimodalparexemple)nouspouvons etre trompés considérablement et nous aurons soit un sur-lissa_ge soit un sous-lissa_ge.

b.2. Methode de validation croisee par ioindres carrés

Pour un no_yau fixé K, le principe de la validation croisée est la minimisation destimateur de ris_que inté_gré (MISE) par rapport a h. En effet, Le MISE dépend de la fonction inconnue f et ne peut donc pas etre calculé. Nous allons essa_yer de remplacer la MISE par une fonction de h, mesurable par rapport a l'échantillon et dont la valeur pour cha_que h > 0, est un estimateur sans biais de MISE(h). Pour cela, notons_que :

MISE(h) = E f {:f_n(x) - f (x)}² dx

= E f

_R Tfi_i(x)²dx - 2E 1 f_n(x) f (x)dx + IR f2 (x)dx

Le dernier terme ne dépend pas de h, pour minimiser MISE(h) il suffit de minimiser l'expression :

J(h) = E f f_n(x)²dx - 2E 1 f_n(x) f (x)dx.

Pour cela, nous déterminons un estimateur des deux termes de J(h). Le premier terme

f_n(x)²dx comme estimateur trivial (d'apres la propriété des esti-

admet l'estimateur

mateurs sans biais : E(^bâ) = â).

Il reste a trouver un estimateur sans biais du second terme. Pour cela, nous admettons par construction l'estimateur sans biais G défini en tout points du support sauf en Xi :

Gb =1

_Xn
i=1

bfn,-i(Xi),

avec

^bfn,-i(x) = 1

n - 1

1 X h

i6=j

(x - Xi ~

K .

Montrons_que E( ^bG) = E{f_R^bf_n(x)f(x)dx}. Comme les Xi sont i.i.d., d'une part nous avons

_~Z ~ _Z ~

_Xn ~x - Xi

E ^bf_n(x)f(x)dx = E K f(x)dx

nh h

R R

i=1

_Z ~x - X1 ~

1 _hE K f(x)dx

_{Z Z} ~x - x1 ~

1 f(x) K f(x1)dx1dx.

h h

R R

D'autre part, nous avons

= E {_n¹

i=1

= E{In,-1(X1)}

= E

? ?

~Xj - X1 ~?

1 _X ?

(n - 1)h h ?

j6=1

~ ₁ ~X - X1 ~~ = E hK h

_{Z Z} ~x - x1 ~

1 f(x) K f(x1)dx1dx

h h

R R

= E ^bf_n(x)f(x)dx.

Donc,^Gb est un estimateur sans biais de f_R biais de J(h) est donne par

f_n(x)f(x)dx. Finalement, l'estimateur sans

CV (h) = f_n(x)² dx - 2 E bfn,-i(Xi).

^Ri=1

Et la fenetre optimale est telle_que

hCV = arg min

h>0

CV (h).

???? ?et??? ?? ??????t?? ?r?sé?_??r ??\u9312‡@???? ?? ?r??s????????

et l'estimateur a no_yau

f_n s'écrit:

D(f , j_n) = f_Rf(x) log {_j.^f_.:₍^x_x⁾₎ dx

= I_R f (x) log f (x)dx - I_R f (x)log { r_n(x)} dx

= E [log { f (X)}] - E [log {f_n(X) }1 .

L'idée de la validation croisée par vraisemblance est de minimiser D(f,

f_n). Toutefois,

cette distance n'est pas métri_que et les critères définis en la minimisant ne sont pas ap-

propriés pour obtenir un lissa_ge adé_quat. Donc minimiser D(f, f_n) revient a maximiser

E [log {f_n(X)}1. Ainsi, la fenetre optimale est

LCV (h),

hLCV = arg max

h>0

LCV (h) = E [log {f_n(X)}]

Par construction, nous avons l'estimateur sans biais de LCV (h):

J_n = n

_Xn
i=1

_{n o}

log ^bfn,-i(Xi|h) ,

^bfn,-i(Xi|h) = (

~Xi - Xj ~

n - 1)h h

i6=j

Montrons _que E(J_n) = E _{h oi.}

log ^bf_n(X)

Comme les variables aléatoires X1,X2, . . . ,X_n sont i.i.d., d'une part nous obtenons

" _o#

_Xn _n

E(J_n) = E log ^bfn,-i(Xi|h)

i=1

_{h n oi}

= E log ^bfn,-1(X1|h)

= E _?log

~X1 - Xj ~? ?

1 X K ?

(n - 1)h h ?

j6=1

= E [log { h 1 K X 1 h X2

D'autre part, nous trouvons

" ( ~)#

_{h n oi X}n ~X - Xi

E log ^bf_n(X) = E log K

nh h

i=1

= E [log { h1_K (X - hX )11

= E(J_n).

Enfin, la fenêtre optimale obtenue par la méthode de validation croisée par vraisemblance se calcule a partir de :

" 1 n

hLCV = arg max log { fn,_i (Xi | h) }1.

h>0 n

i=1

Cependant, cet estimateur est très sensible aux valeurs aberrantes. Sa diiculté apparait lors_que la méthode est appli_quée a des observations dont la distribution présente de_grandes_queues. Les points situés dans les_queues de la distribution a estimer ont des valeurs faibles, ce_qui impli_que de faibles valeurs des estimations correspondantes. La présence de l'opérateur log dans l'expression de l'estimateur pose un problème de conver_gence pour les valeurs de densités aux_queues. Par consé_quent, il estest diicile dans ce cas de choisir hLCV de fa_con optimale, puis_que l'on ris_que soit le sur-lissa_ge soit une trop_grande erreur sur les_queues.

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"I don't believe we shall ever have a good money again before we take the thing out of the hand of governments. We can't take it violently, out of the hands of governments, all we can do is by some sly roundabout way introduce something that they can't stop ..." Friedrich Hayek (1899-1992) en 1984