3.5.
Méthodes d'analyse des données
Compte tenu de nos objectifs et de la nature de nos variables,
nous allons recourir à l'analyse descriptive et l'analyse explicative.
En effet, il ne suffit pas de faire au niveau brut une analyse descriptive de
la relation entre la pauvreté et la mortalité des enfants. Nous
allons poursuivre l'analyse en faisant appel à l'analyse explicative
afin de mesurer l'impact de la pauvreté sur la mortalité des
enfants de moins de cinq ans. Nous nous servirons des procédures
statistiques suivantes : les fréquences, les tableaux
croisés, et la régression logistique.
3.5.1. L'analyse
descriptive bivariée
L'analyse bivariée consiste à examiner
l'existence éventuelle d'une relation de dépendance entre la
variable à expliquer et chacune des variables explicatives.
L'observation (analyse bivariée) se réalise après
l'analyse des relations présomptueuses (prouvée par le
Khi-deux) pour permettre de mesurer les effets de chaque
groupe de facteurs de la pauvreté sur le décès des
enfants. C'est une étape vers l'analyse multivariée.
La description bivariée et la mise en évidence
d'une corrélation ne suffisent pas pour montrer qu'il y a une relation
causale entre deux variables. En effet, la corrélation entre deux
variables, aussi intense soit-elle, peut toujours être due à une
troisième variable cachée.
L'analyse bivariée, à la différence de la
régression multivariée, ne permet pas de situer à
l'éventualité de l'existence d'une variable caché. C'est
pour cela qu'elle ne prouve jamais l'existence d'une relation causale.
D'où la nécessité d'une analyse multivariée.
3.5.2. L'analyse
explicative multivariée
L'analyse multivariée est indispensable pour sortir des
contraintes de l'analyse descriptive (Bocquier, 1996). C'est une méthode
d'analyse multidimensionnelle permettant de prendre en compte plusieurs
facteurs susceptibles d'influencer le décès des enfants.
L'analyse multivariée présente l'avantage de fournir l'effet de
chacun des variables indépendantes. Toutes choses étant
égales par ailleurs, les variables indépendantes introduites dans
le modèle doivent être non collinéaires entre elles. La
régression logistique appliquée au niveau bivariée sera
appliquée.
3.5.2.1. Principe de la
méthode
Pour notre étude, notons Y la variable
dépendante (décès des enfants) et Xi (i = 1, 2, 3, 4 ...,
n) les variables indépendantes. La nature de la variable Y est
dichotomique (prend 1 pour la modalité décès et 0 si non).
Soit P la probabilité pour que l'enfant décède et 1-P la
probabilité qu'il survive jusqu'au cinquième anniversaire, Le
modèle de régression permet de poser cette équation :
Z=log [(p/ (1-p)] ;
-soit sous la forme linéaire
Z=â0+â1X1+â2×2+...+ânXn,
-soit sous la forme multiplicative : ez=p/ (1-p)
? p=åz/ (1+e)=odds ratio, ce qui veut dire le
rapport de chances. â0 est le terme indépendant de
l'équation exprimant le niveau moyen pour toutes valeurs des variables
indépendantes (Xi) et â0 les coefficients rattachés
à chacune des variables indépendantes Xi. Nos variables
explicatives qui sont pour la plupart catégorielles seront
dichotomisées avant d'être introduites dans le modèle.
Cependant il faut prendre soin de retenir pour chaque variable
une modalité comme référence. Cette dernière
modalité ne sera pas introduite dans le modèle et servira de
référence pour l'explication des paramètres
rattachés aux autres modalités de la même variable. Pour
hiérarchiser les variables ou encore de faire ressortir la contribution
de chaque variable à l'explication, on procède au modèle
pas à pas. Ce modèle s'applique à la recherche des
mécanismes d'action aux variables intermédiaires.
La régression logistique fournit, entre autres, le
nombre d'observations, la probabilité du Chi deux associée au
modèle, les rapports de chance (odds ratios), le seuil de signification
pour chacun des paramètres (Exp (â) ou odds ratios). On peut aussi
se référer à la table de classification du modèle
qui permet de comparer les valeurs prédites par le modèle aux
valeurs réellement observées.
3.5.2.2.
Interprétation des résultats
On interprète l'adéquation du modèle par
rapport aux données utilisées que l'incidence de la variable
indépendante sur la variable dépendante (décès des
enfants). La probabilité du Chi-deux associée au modèle
permet de se prononcer sur l'adéquation du modèle par rapport aux
données utilisées ; c'est-à-dire la capacité des
facteurs introduits dans le modèle à expliquer le
phénomène étudié. Dans le cas de figure, nous
considérons que le modèle est adéquat lorsque le seuil de
signification associé au Chi-deux est inférieur à 5.
Pour ce qui est du risque de mortalité, le
modèle de régression logistique fournit pour chaque variable
introduite dans l'équation, une probabilité (p>|z|) qui
indique le seuil de signification du paramètre relatif à la
modalité considérée. Lorsque cette probabilité est
inférieure à 5%, nous considérons qu'il existe une
mortalité différentielle significative entre les enfants
présentant la caractéristique de la modalité
considérée et ceux de la modalité de
référence. L'écart de risque est calculé à
partir des rapports de chances (odds ratio). Lorsque ce rapport de chances est
inférieur à 1 les enfants ayant la caractéristique de la
modalité considérée de la variable explicative ont (1-odds
ratio) moins de chance que leurs homologues de la modalité de
référence de ne pas décéder. Par contre, lorsque ce
rapport de chances est supérieur à 1, cela signifie que les
individus de la modalité considérée de la variable
explicative ont (odds ratio-1) plus de risque de décéder que
leurs homologues de la modalité de référence. Les
résultats de la régression logistique s'interprète donc de
la manière Les déterminants de la disparité
régionale de la mortalité infanto-juvénile en Mauritanie
suivante : si la variable indépendante augmente d'une unité,
alors le rapport de chance augmente de eâi
unités traduisant ainsi les influences de la variable explicative
considérée sur la variable dépendante.
|