2.2 Présentation de la base des données et
traitement des données
La base de données fournit est en format SPSS. Les
fichiers d'étude sont : le fichier des ménages (7.552
ménages et 143 variables) et le fichier des biens durables
possédés par le ménage (37.739 individus et 9
variables).
Le fichier des biens durables possédés par le
ménage a été agrégé en fonction des
variables « numéro » et « identifiant » du
ménage ; ces deux variables sont présentent dans tous les
fichiers de la base de données. Nous avons fait une fusion (ajout de
variables) entre les deux fichiers afin d'obtenir un seul. Ce dernier nous a
servi comme fichier de travail. Le traitement des données a
été effectué grâce au logiciel SPSS.
Mémoire de fin d'études
16
2.3 Méthodes d'analyse utilisées
Pour procéder à l'analyse des données de
notre étude, nous avons fait recours à trois méthodes.
Dans un premier temps, une classification ascendante
hiérarchique a permis de dresser une typologie des ménages selon
leurs caractéristiques.
Dans un second temps, une analyse bivariée a
été utilisée. On étudiera à l'aide du test
de Khi-deux et de l'Anova à un facteur la liaison entre la variable
dépendante et les différentes variables indépendantes ou
explicatives. Si une variable n'est pas liée avec la variable
dépendante, on l'élimine de l'étude.
Enfin, une analyse discriminante a été
réalisée afin d'identifier les variables discriminant la variable
dépendante en tant que variable nominale admettant comme
modalités le nombre de groupes constitués et décrivant
l'appartenance des individus (ménages) aux groupes identifiés
à l'issu de la CAH.
2.3.1 Principe de la classification ascendante
hiérarchique (CAH)
La classification hiérarchique constitue depuis
longtemps une forme de classification très populaire. Elle a l'avantage
d'être interprétable visuellement à l'aide des graphes ou
dendrogramme. Elle est utilisée dans différents domaines : la
taxinomie, la biologie, les réseaux de télécommunications,
le marketing, etc.
C'est une méthode de classification qui consiste
à fusionner deux objets (ou individus) au sens d'une mesure de
proximité de sorte que deux objets groupés à une
étape le restent jusqu'au terme du processus de classification. Il
s'agit ici, à partir des éléments terminaux, de former de
petites classes ne comportant que des individus les plus semblables, et on
continue le processus jusqu'à l'obtention d'une seule classe
formée de tous les éléments.
Les étapes d'une classification ascendante
hiérarchique
Avant de lancer une quelconque classification, il faut
respecter au préalable les étapes suivantes :
Étape 1 : Il faut sélectionner
les individus à classer ou les variables qui serviront pour
critère de classification.
Mémoire de fin d'études
17
Étape 2 : On choisit une distance ou
un indice d'écart entre paires d'individus. La distance
généralement utilisée dans les algorithmes de
classification hiérarchique est le carré de la distance
euclidienne.
Étape 3 : On choisit une règle de
calcul pour les distances entre classes.
Étape 4 : On détermine un
critère d'agrégation des individus dans les classes.
Pour rappel la méthode de Ward (la plus populaire) est
un critère d'agrégation, elle consiste à choisir à
chaque étape le regroupement de classes tel que l'augmentation de
l'inertie intra-classe, utilisée comme indice de niveau, soit
minimum.
|