3.3.1.2 Vérification de la validité de
l'étude
On estime la validité d'une analyse discriminante à
partir des trois indicateurs ci-dessous :
V' Le test de Box.
V' La corrélation globale. V' Le Lambda
de Wilks.
La statistique M de Box, basée sur le logarithme
népérien du déterminant de chaque matrice de
variance-covariance, permet de construire un test multivarié pour la
comparaison des matrices de variance-covariance. Ce test permet de
vérifier le postulat d'homogénéité des matrices de
variance-covariance entre les deux groupes Le test de Box qui est un test
global, permet de dire si oui ou non les matrices de covariances sont
égales dans les différents groupes.
Hypothèses du test
V' H0 : les matrices de covariances sont identiques
dans les deux groupes. V' H1 : les matrices de covariances sont
différentes dans les deux groupes.
36
Prise de décision
y' Si alpha < 0,05 cela signifie qu'il est possible
d'utiliser les variables que nous avons
pour construire le modèle. Il ya au moins une variable
qui a un pouvoir discriminant. y' Si alpha > 0,05 cela signifie que
l'analyse n'est pas valide. Il est alors recommandé de
chercher d'autres variables pour continuer l'analyse.
Ce test a permis en effet de rejeter au seuil de 0,05
l'hypothèse nulle d'égalité des matrices des covariances,
puisque le Fisher est de 318,519 et le niveau de signification est de 0,000. Le
test M de box confirme que l'on ne peut pas accepter l'hypothèse H0 :
les matrices de covariances sont identiques pour les deux groupes (le test est
significatif au niveau de signification de 0.05). Donc, nous pouvons continuer
l'analyse discriminante.
Tableau 07 : Résultats du test M de
Box
|
M de Box
|
38323,236
|
|
Fisher
|
Approximativement
|
318,519
|
|
ddl1
|
120
|
|
ddl2
|
59226789
|
|
Signification (á)
|
0,000
|
Source : Calcul de l'auteur sur les données de l'ELEP 2007
sous SPSS Teste l'hypothèse nulle d'égalité de matrices de
covariance des populations.
Les valeurs apparaissant dans la colonne « Log
Déterminant » correspondent à des mesures de dispersion pour
chacun des groupes des matrices de variance-covariance.
Tableau 08 : logarithme
népérien du déterminant de la matrice de variance
covariance pour chaque groupe du niveau de vie
|
Niveau de vie
|
Rang
|
Déterminant Log
|
|
Pauvre
|
15
|
-32,019
|
|
Non Pauvre
|
15
|
-35,365
|
|
Intra-groupes combinés
|
15
|
-27,911
|
Les rangs et logarithmes naturels des déterminants
imprimés sont ceux des matrices de covariance du groupe.
Les valeurs du logarithme des déterminants des matrices de
variance-covariance relatives à chacun des groupes dans l'espace des
variables explicatives font apparaitre le groupe des pauvres avec l'espace
présentant le plus de variabilité relativement aux variables
explicatives retenues. Tandis que le groupe des non pauvres apparait comme le
plus homogène par rapport aux variables explicatives.
Puisque la variable à expliquer admet deux
modalités, l'analyse discriminante a fourni une seule fonction
discriminante. Le nombre de dimensions est le plus petit du nombre de
groupes
Mémoire de fin d'études
37
Mémoire de fin d'études
moins 1. La valeur propre de la fonction discriminante est
égale à 1,689. Le pourcentage de la variance totale
expliqué par la fonction discriminante est de 100 %.
On appelle corrélation canonique la corrélation
entre la fonction discriminante et la variable dépendante. Le
coefficient de corrélation canonique (qui doit être naturellement
le plus proche de 1) est de 0,793 pour la fonction discriminante canonique.
Plus elle est proche de 1, meilleur est le modèle.
Tableau 09 : Valeur propre et coefficient de
corrélation canonique associé à la fonction
linéaire discriminante
|
Fonction
|
Valeur propre
|
% de la variance
|
% cumulé
|
Corrélation canonique
|
|
1
|
1,689a
|
100,0
|
100,0
|
0,793
|
Source : Calcul de l'auteur sur les données de l'ELEP 2007
sous SPSS a. Les 1 premières fonctions discriminantes canoniques ont
été utilisées pour l'analyse.
La corrélation canonique élevée au
carré s'interprète comme le pourcentage de la variable
dépendante expliqué globalement par le modèle. Dans notre
cas, les variables explicatives arrivent à expliquer 62,9 %
(0,7932) de la variance de la variable dépendante, ce qui
trouve que la fonction discriminante se dote d'un pouvoir explicatif fort.
La statistique associée au lambda de Wilks suit une
distribution du Khi-deux à 15 degrés de libertés sous
l'hypothèse nulle d'égalité des moyennes des deux groupes
pour les quinze variables introduites dans le modèle.
Le lambda de wilks de la fonction discriminante est
égal 0,372. Plus la valeur du Lambda de Wilks est proche de 0 meilleur
est le modèle.
Le test du lambda de wilks est significatif au seuil de 0,05
pour la fonction discriminante. Ce qui veut dire que les scores moyens des deux
groupes d'après la fonction linéaire discriminante
diffèrent significativement.
Tableau 10 : Récapitulatif de la fonction
discriminante canonique
|
Test de la ou des fonctions
|
Lambda de Wilks
|
Khi-deux
|
ddl
|
Signification (á)
|
|
1
|
0,372
|
7460,988
|
15
|
0,000
|
38
Source : Calcul de l'auteur sur les données de l'ELEP 2007
sous SPSS
Mémoire de fin d'études
|