WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse en composantes principales de densités de probabilité estimées par la méthode du noyau

( Télécharger le fichier original )
par Smail Yousfi
Université Mouloud Mammeri de Tizi-Ouzou, Algérie - Magister 2007
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

4.3 Choix de la fenêtre de lissage

Posons maintenant:

h4 4 R(K)

AMISE(h,t) = 4 óKR(ft ) +

t ? {1,...,L} (4.29)

nth

l'erreur quadratique asymptotique entre ft et fh,t. Si les densités ft, t ? {1,...,L} et le noyau K vérifient les conditions des théoremes 2.2.1 et 2.2.2. Nous proposons de choisir la fenetre dite optimale, celle qui minimisera la fonction suivante:

Ö(h) =

XL
t
=1

AMISE(h,t). (4.30)

En utilisant le théoreme 2.2.3 on obtient:

L

hoptimale = á(K) [ER(ft ")

t=1

#--

5 XL

1 !

1

t=1 nt

1
5

.

(4.31)

L --

hoptimale = á(K) [ER(ft )i

5

(L

1 )1 5 .

(4.32)

n

t=1

Si nt = n, pour t ? {1,...,L} alors:

Exemples de calcul de R(ft "):

a) Cas de la famille de densites de lois 12N(t,vt)+ 12N(0,vt)

?x ? R, ft(x) = 1 (2 ( x vt )2'

e- 1 2 ( x-t

vt )2 + e- 1

(4.33)

2vtv2ð

· vt )2

(x - t

f00

t (x) = 1 vt )2 - e- 1 2 ( x

v vt )2e- 1 2 ( x-t

vt )2 - e- 1 2 ( x-t

vt )2 + ( x vt)2e- 1 2 ( x . (4.34)

2t t
Par un calcul simple on trouve:

f00t2 (x)dx = 1

R(ft ") = I81E3 [2I1(t) - 4I2(t) + 2I3(t) + 2I4(4) - 4I5(t) + 2I6(t)]

avec:

) ( x.vtt )2 dx,

I1(t) = L(x.`7:\ 4e- I2(t) = fa(x.`7:)2e-(xvt t 2 dx

), I3(t) = RIe-( xvt t )2dx.

[(w)2#177;( :t)2] dx I5(t) = 16(t) , )2e [(w)2#177;(:t)2]dx, = e[(w)2+( :t)2]dx.

I4(t) = L( x-tvt )2( \x/t)2e

Calculons maintenant les Ii(t), i = 1,6.

I1(t) = L(x-t t-le-

) (xt t)2dx = vtL y4e-y2dy = 4vÐvt.

v

I2(t) = R IR(x-t

vt (xvt t)2dx = vt L y2e-y2dy = 1 Ðvt.

2

v

I3(t) = RIe (xvt t)2 dx = vt L e-y2dy = Ðvt.

Soit le changement de variable y = xvt, alors: I4(t) =

f( ) - t\2( ) X \ 2e- 12 [(x-t)2+( ,74 )2] dx v.

t

a

= f (y -

a I (y - .0)2y2e-[(y-vt)2+y2]dy

v t)2y2e-[(y- 1/2t )2- 4]dy = v te-4 f(y - v t)2y2e-(yvP2dy

a

= vte- t 4 I y4e-(y-

a v2 t )2dy - 2te- t 4 I y3e-(y-

a 1/2t )2 dy + I y2e-(y-2t)2dy

a

= v te- 4 f(y+ 2)4e-y2dy-2te4 f(y + 2)3e-y2dy I (y + 2)2 e-y2

a

· v

v v

t(3 v v

Ð + 3 v v

Ðt + 1 Ð + 1 v

Ðt2) - 2t(3 t + 1

v v v t(1 e- t

= Ð Ðt t) + t Ðt) 4 .

4 4 16 4 8 2 4

En utilisant la même démarche on trouve:

v i

I5(t) = vte- t h1 v

Ð + 1

4 Ðt

2 4

(t) = vÐvte- 4. Par conséquent:

vt ·1

R(f00

t ) = v 8t2e- t 4 - 3 2te- t 4 + 3 2(e- t 4 + 1) (4.35)

8 Ðt3

b) Cas de la famille de densités de lois 12N(t,vt)+ 12N(0,1)

?x ? R, ft(x) = 1

2vtv2ð e

2 (xvt t )2 + 1

2v2ð e

1 2

2 x .(4.36)

· 1 2 x2

f00

t (x) = v 1 tvt e- 1 2 ( x-t

tvt(x - t

vt )2e- 2 1 ( x-t

vt )2 - 1 vt )2 + x2e- 1 2 x2 - e- 1 . (4.37)

2 2Ð

En utilisant les notations de l'exemple précédent, nous avons:

· 1

R(f00

t ) = 1 t3 I1(t) - t3 2 I2(t) + t3 1 I3(t) + 2

tvtI0 1(t) - 2

tvtI0 2(t) - 2

tvtI0 3(t) + 2

tvtI0 4(t) + I0 5(t)

(4.38)

avec:

I1 (t) = fri(xv-tt)2 x2e-12[( x.itt )2+x21 _x,

'd (t) = fil(x.`7:)2e-12[( x.7:)2+x2]dx,

I3(t) = f,x2e-[(x%.7t t)2+x2]dx,

[(x.tt )2+x21 _x,

4(t) = fit e 'd 4 (t) = fE(x4 - 2x2 +1)e-x2dx.

Il reste a calculer I0i(t), i = 1,5. En utilisant le changement de variable y = x vt,nous avons:

fli,(x v- tt )2 x2e-[(xtt)2+x2]dx

(t) = = tvt (y- vt)2 y2e-[(y-NA)2+ty2]dy RI

= I(y - .0)2 y2e-[(t+1)y2-2vty]dy = I(y- vt)2 y2e-11[y2 dy

a

= Wte2+ 2(t+1) f(y vt)2 y2e-[vt21 (y-t,/Ft1)] 2 dy.

Posons z = qt+1

2 (y- t+1), alors:

vt

2 2

(t) =

z t v+ t1 e-z2dz

Wt\/ 2 e2+ 2(tt +1) 2z

t +1 t + 1 t t+ 1 t + 2

r " v #

v 2 v

= t t t + 1e- 2 t + t 3 Ð

2(t+1) (t + 1)2 + t3 - 4t2 + t v Ð + t4 Ð .

(t + 1)3 (t + 1)4

En utilisant la même démarche on trouve:

i.

I02(t) = vt q 2 hv v

t+1e- t 2 + t Ð

2(t+1) t+1 + t3 Ð

(t+1)2

i.

I0 3(t) = tvt q 2 hv v

t+1e- t 2 + t Ð

2(t+1) t+1 + t Ð

(t+1)2

q 2

I0 4(t) = vt v 2(t+1)

.

Ð t+1e- t 2 + t

I5(t) = 34vÐ.

En remplacant ces termes dans la formule (4.38), on obtient:

v2 ·t4 - 6t3 - 3t2 + 6t + 3 vt

R(f00 e- 2 t + t

2(t+1) + 3

t ) = v (t + 1)4vt + 1 v Ð( t3 + 1). (4.39)

4 Ð 32

c) Cas de la famille de densites de lois N(t,vt).

1 -

?x ? R, ft(x) = 1 vtv2ð e- 2 ( \ xvt )2 .(4.40)

· vt )2

f00 2 ( x-t

t (x) = 1 (x - t vt )2 - e- 1

v vt )2e- 1 2 ( x-t . (4.41)

t t

Avec les notations de l'exemple 1, nous avons:

vt

R(f00

t ) = 1

t3 [I1(t) - 2I2(t) + I3(t)] = v 3 (4.42)

8 Ð t3 .

Nous souhaitons maintenant a l'aide des 4 exemples traités dans le paragraphe 3.1, de faire une comparaison entre la qualité de l'estimation de l'ACP théorique obtenue en utilisant la fenêtre optimale donnée par la relation 4.31 et celle obtenue en associant a chaque densité la fenêtre optimale au sens de l'erreur quadratique intégrée asymptotique donnée par la formule 2.17.

Pour des raisons de simplicité nous avons choisi d'estimer les densités en utilisant le noyau gaussien. Le caractére asymptotique des fenêtres précédentes, nous exige de choisir des tailles d'échantillons suffissament grandes, ici nt = n = 30, t ? {1,...,30}.

a) Cas de la famille de densités de lois1 2N(t,vt) + 1 2N(0,vt).

Les valeurs des aj sur les 3 premiers axes principaux, ainsi celles des â obtenues dans les deux situations précédentes sont données par le tableau 6.

 

fenêtres AMISE

hoptimale = 1.16

a1

1.34

2.38

a2

3.36

2.89

a3

2.91

2.61

â

1.71

5.72

Tab.6: Valeurs des áj sur les 3 premiers axes principaux, ainsi celle de â, obtenues lors d'une ACP sur les densités estimées, dans le cas des fenëtres AMISE et la fenëtre hoptimale. (Famille de densités de lois 1 2 N(t,V't) + 1 2 N(0,V't)), n = 30

Les projections des densités estimées sur le premier plan principal, ainsi que les pourcentages d'inertie sur les deux premiers axes principaux dans le cas des deux situations précédentes, sont données par les graphiques de la figure 20.

12% Fenëtres AMISE 11% hoptimale = 1.16

0.6

0.4

0.2

3 . 8
65

0.6
0.4

70% 0.2

64%

Fig.20: Allure du nuage des densités sur le premier plan principal, obtenues lors d'une ACP

16 17 19 . 1 17

19

sur les densités estimées en utilisant les fenëtres AMISE et la fenëtre hoptimale.

-.2

. 18

2829

(cas de la famille de densités de lois 1

. 2 . 21

. 22 25 2 N(t,V't) + 1 2 N(0,V't)), n = 30.

26

b) Cas de la famille de densités de lois1 2N(t,vt) + 1 2N(0,1).

Les valeurs des aj sur les 3 premiers axes principaux, ainsi celles des â obtenues dans les deux situations précédentes sont données par le tableau 7.

 

fenêtres AMISE

hoptimale = 0.43

a1

5.32

5.36

a2

2.00

1.90

a3

2.91

2.66

â

9.52

9.56

Tab.7: Valeurs des áj sur les 3 premiers axes principaux, ainsi celle de â, obtenues lors d'une ACP sur les densités estimées,

dans le cas des fenëtres AMISE et la fenëtre hoptimale. (Famille de densités de lois 1 2 N(t,./t) + 1 2 N(0,1)), n = 30

Les projections des densités estimées sur le premier plan principal, ainsi que les pourcentages d'inertie sur les deux premiers axes principaux dans le cas des deux situations précédentes sont données par les graphique de la figure 21.

7% Fenëtres AMISE 7% hoptimale = 0.43

0.7
0.5
0.3

 

71%

 
 

71%

 
 
 
 
 
 
 
 

Fig.21: Allure du nuage des densités sur le premier plan principal, obtenues lors d'une ACP

.

17 1 . . 4

1

0.0 17

sur les densités estimées en utilisant les fenëtres AMISE et la fenëtre hoptimale.

1

18

02

(cas de la famille de densités de lois 1

22 21

. 2 N(0,1)), n = 30.

24526 2 N(t,./t) + 1

c) Cas de la famille de densités de lois N(t,vt).

Les valeurs des aj sur les 3 premiers axes principaux, ainsi celles des â obtenues dans les deux situations précédentes sont données par le tableau 8.

 

fenêtres AMISE

hoptimale = 1.00

a1

1.43

1.51

a2

1.64

1.73

a3

2.37

2.38

â

2.81

2.76

Tab.8: Valeurs des áj sur les 3 premiers axes principaux, ainsi celle de â, obtenues lors d'une ACP sur les densités estimées, dans le cas des fenëtres AMISE et la fenëtre hoptimale. (Famille de densités de lois N(t,v't)), n = 30

Les projections des densités estimées sur le premier plan principal, ainsi que les pourcentages d'inertie sur les deux premiers axes principaux dans le cas des deux situations précédentes sont données par les graphique de la figure 22.

26% Fenëtres AMISE 25% hoptimale = 1.00

 
 
 
 
 
 
 
 
 
 
 
 
 
 

46%

 
 
 
 
 

41%

 
 
 
 
 
 
 
 
 

Fig.22: Allure du nuage des densités sur le premier plan principal, obtenues lors d'une ACP

16 17 16

. 17

sur les densités estimées en utilisant les fenëtres AMISE et la fenëtre hoptimale.

. 18

(cas de la famille de densités de lois N(t,v't)), n = 30.

0.1

20

d) Cas de la famille de densités de Gumbel.

Les valeurs des aj sur les 3 premiers axes principaux, ainsi celles des â obtenues dans les deux situations précédentes sont données par le tableau 9.

 

fenêtres AMISE

hoptimale = 0.76

a1

1.93

2.56

a2

2.31

2.66

a3

1.71

1.71

â

1.61

3.65

Tab.9: Valeurs des áj sur les 3 premiers axes principaux, ainsi celle de â, obtenues lors d'une ACP sur les densités estimées, dans le cas des fenëtres AMISE et la fenëtre hoptimale. (Famille de densités de Gumbel), n = 30

Les projections des densités estimées sur le premier plan principal, ainsi que les pourcentages d'inertie sur les deux premiers axes principaux dans le cas des deux situations précédentes sont données par les graphiques de la figure 23.

23% Fenëtres AMISE 21% hoptimale = 0.76

13 .

38%

33%

Fig.23: Allure du nuage des densités sur le premier plan principal, obtenues lors d'une ACP

9 9

sur les densités estimées en utilisant les fenëtres AMISE et la fenëtre hoptimale.

0

(cas de la famille de densités de Gumbel), n = 30.

. 22

Les résultats obtenus précédemment concernant les valeurs des áj sur les 3 premiers axes principaux donnés par les tableaux 6, 7, 8 et 9, ainsi celles des valeurs des â, montrent que la différence entre les deux procédures d'estimations n'est pas très importante.

L'allure du nuage des densités sur le premier plan principal donnée par les graphiques des figures 20, 21, 22 et 23 ainsi que les pourcentages d'inertie expliqués par les deux premiers axes principaux, montrent aussi que les deux procédures d'estimation ont donné des résultats très proches, a l'exception du premier exemple, oi nous avons enregistré une différence du pourcentage d'inertie de 6% sur le premier axe principal.

En conclusion, nous pouvons dire que dans les deux cas, nous sommes amenés a minimiser l'erreur quadratique entre la densité f et son estimation. La différence réside dans le fait que, l'emploi de la fenêtre hoptimale, signifie que l'ACP sur les densités estimées est faite en minimisant globalement toutes les erreurs quadratiques intégrées asymptotiques. Tandis que dans l'autre procédure d'estimation, l'ACP est faite en minimisant localement les erreurs quadratiques intégrées asymptotiques et cela en associant a chaque densité la fenêtre de lissage optimale au sens de l'AMISE.

Remarque.

La largeur de la fenêtre hoptimale dépend, a travers les paramètres R(f00

t ), t ? {1,...,L} des densités inconnues ft, et ne peut donc être utilisée telle quelle dans les calculs. Pour remédier a ce problème nous proposons d'estimer les quantités R(f00

t ), en remplaçant les ft par un modèle

paramétrique approprié, par exemple le modèle de Park et Marron (1990) suivant:

(x) = ëg1(x

1 ë)

(4.43)

oi ë représente une mesure d'échelle de la densité ft, par exemple sont écart-type, et g1 désigne une densité de référence connue d'echelle 1.

Si xt,1,...,xt,n, n réalisations de la variable aléatoire de densité ft d'ecart-type ót et g1 la densité gaussienne N(0,1), alors l'estimation de R(f00

t ) est donnée par:

àR(f0'

t ) = v 3 (4.44)

8 Ðs2 t

st l'estimation par maximum de vraisemblance de ót

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Et il n'est rien de plus beau que l'instant qui précède le voyage, l'instant ou l'horizon de demain vient nous rendre visite et nous dire ses promesses"   Milan Kundera